DIPLOMARBEIT
DIPLOMARBEIT
DIPLOMARBEIT
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2.3 Spracherkennung<br />
Jahr Ereignis<br />
1984 IBM stellt ein Spracherkennungssystem vor, das mit Hilfe eines Großrechners ca. 5000<br />
Einzelworte in einem mehrere Minuten dauerndem Vorgang erkennen konnte.<br />
Die 1982 von ehemaligen IBM‐Mitarbeitern gegründete Firma Dragon Systems bringt mit<br />
dem Dragon Dictate System das erste Spracherkennungssystem für tragbare Computer<br />
auf den Markt.<br />
1986 IBM präsentiert das System TANGORA 4 für Englisch (benannt nach dem Weltmeister im<br />
Maschineschreiben). Das System arbeitete in Echtzeit auf einem normalen Arbeitsplatz‐<br />
rechner. Dies war möglich durch Spezialprozessoren. Durch Kontextprüfung mittels Trig‐<br />
rammstatistik 6 konnten auch Homophone 7 unterschieden werden.<br />
ab 1988 Entwicklung einer deutschen Version von TANGORA. Sie fand Einsatz in Medizin, Ge‐<br />
richtswesen und Geschäftskorrespondenz. Jedes Einsatzgebiet hatte ein eigenes Vokabu‐<br />
lar von etwa 20‐30 tausend Worten (jede Wortform als eigenes Wort gezählt).<br />
1991 Auf der CeBIT wird TANGORA 4 deutsch vorgestellt. Die Präsentation musste in einem<br />
abgeschirmten Raum stattfinden, um das System vor dem Messelärm zu schützen.<br />
1992 Die TANGORA‐Technik ist ein einem Produkt verfügbar: der ISSS (IBM Speech Server Se‐<br />
ries). Dabei handelte es sich um eine Client/Server Lösung mit einem IBM RS/6000‐<br />
Server. Die akustische Eingabe konnte z.B. auf einem PC mit OS/2 erfolgen. Einsatz fand<br />
dieses System besonders in Krankenhäusern und Kliniken.<br />
1993 Ankündigung eines neuen auf TANGORA‐Technologie basierenden Produktes: IBM Perso‐<br />
nal Dictate System (später in IBM VoiceType umbenannt). Der Preis betrug weniger als<br />
1000$ (vorher haben Spracherkennungssysteme meistens mehr als 10000$ gekostet). Es<br />
war als reine PC‐Lösung ein Produkt für den Massenmarkt<br />
1994 Vorstellung der englischen Version von IBM VoiceType auf der CeBIT, wenige Wochen<br />
später auch als deutsche Version.<br />
Die 1990 gegründete Philips Tochter Philips Dictation Systems stellt die erste Lösung für<br />
die Erkennung von kontinuierlicher Sprache vor.<br />
1995 Vorstellung von IBM VoiceType mit speziellem Fachvokabular für Mediziner und Anwälte<br />
auf der CeBIT. Die Präsentation war sogar in lautester Messeatmosphäre möglich.<br />
1996 Vorstellung von IBM VoiceType Diktiersystem 3.0 für Windows 95 auf der CeBIT. Es wurde<br />
keine IBM‐Audiokarte mehr benötigt und das System lief auch auf Windows 95.<br />
1997 Philips Dictation Systems bringt SpeechMagic auf den Markt, eine Client/Server fähige<br />
Spracherkennungslösung.<br />
Die 1987 gegründete Firma Learnout & Hauspie stellt ihr erstes Spracherkennungspro‐<br />
dukt vor.<br />
1998 Mit FreeSpeech98 bringt Philips Dictation Systems ein Konsumentenprodukt für den<br />
Massenmarkt heraus.<br />
Spracherkennungsprodukte von Learnout & Hauspie sind nun auch in deutscher Sprache<br />
verfügbar.<br />
Tabelle 6: Zeitlicher Abriss der Entwicklungen auf dem Gebiet der Spracherkennung<br />
6<br />
Ein Trigramm ist eine Wortkette bestehend aus drei Wörtern. Durch Untersuchung von Texten kann eine Liste<br />
ermittelt werden, die die Wahrscheinlichkeiten für das Auftreten verschiedener Trigramme enthält.<br />
7<br />
Wörter mit einer ähnlichen oder identischen Aussprache, aber unterschiedlicher Bedeutung (z.B. rein und<br />
Rhein)<br />
20