31.10.2012 Aufrufe

DIPLOMARBEIT

DIPLOMARBEIT

DIPLOMARBEIT

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2.3 Spracherkennung<br />

Jahr Ereignis<br />

1984 IBM stellt ein Spracherkennungssystem vor, das mit Hilfe eines Großrechners ca. 5000<br />

Einzelworte in einem mehrere Minuten dauerndem Vorgang erkennen konnte.<br />

Die 1982 von ehemaligen IBM‐Mitarbeitern gegründete Firma Dragon Systems bringt mit<br />

dem Dragon Dictate System das erste Spracherkennungssystem für tragbare Computer<br />

auf den Markt.<br />

1986 IBM präsentiert das System TANGORA 4 für Englisch (benannt nach dem Weltmeister im<br />

Maschineschreiben). Das System arbeitete in Echtzeit auf einem normalen Arbeitsplatz‐<br />

rechner. Dies war möglich durch Spezialprozessoren. Durch Kontextprüfung mittels Trig‐<br />

rammstatistik 6 konnten auch Homophone 7 unterschieden werden.<br />

ab 1988 Entwicklung einer deutschen Version von TANGORA. Sie fand Einsatz in Medizin, Ge‐<br />

richtswesen und Geschäftskorrespondenz. Jedes Einsatzgebiet hatte ein eigenes Vokabu‐<br />

lar von etwa 20‐30 tausend Worten (jede Wortform als eigenes Wort gezählt).<br />

1991 Auf der CeBIT wird TANGORA 4 deutsch vorgestellt. Die Präsentation musste in einem<br />

abgeschirmten Raum stattfinden, um das System vor dem Messelärm zu schützen.<br />

1992 Die TANGORA‐Technik ist ein einem Produkt verfügbar: der ISSS (IBM Speech Server Se‐<br />

ries). Dabei handelte es sich um eine Client/Server Lösung mit einem IBM RS/6000‐<br />

Server. Die akustische Eingabe konnte z.B. auf einem PC mit OS/2 erfolgen. Einsatz fand<br />

dieses System besonders in Krankenhäusern und Kliniken.<br />

1993 Ankündigung eines neuen auf TANGORA‐Technologie basierenden Produktes: IBM Perso‐<br />

nal Dictate System (später in IBM VoiceType umbenannt). Der Preis betrug weniger als<br />

1000$ (vorher haben Spracherkennungssysteme meistens mehr als 10000$ gekostet). Es<br />

war als reine PC‐Lösung ein Produkt für den Massenmarkt<br />

1994 Vorstellung der englischen Version von IBM VoiceType auf der CeBIT, wenige Wochen<br />

später auch als deutsche Version.<br />

Die 1990 gegründete Philips Tochter Philips Dictation Systems stellt die erste Lösung für<br />

die Erkennung von kontinuierlicher Sprache vor.<br />

1995 Vorstellung von IBM VoiceType mit speziellem Fachvokabular für Mediziner und Anwälte<br />

auf der CeBIT. Die Präsentation war sogar in lautester Messeatmosphäre möglich.<br />

1996 Vorstellung von IBM VoiceType Diktiersystem 3.0 für Windows 95 auf der CeBIT. Es wurde<br />

keine IBM‐Audiokarte mehr benötigt und das System lief auch auf Windows 95.<br />

1997 Philips Dictation Systems bringt SpeechMagic auf den Markt, eine Client/Server fähige<br />

Spracherkennungslösung.<br />

Die 1987 gegründete Firma Learnout & Hauspie stellt ihr erstes Spracherkennungspro‐<br />

dukt vor.<br />

1998 Mit FreeSpeech98 bringt Philips Dictation Systems ein Konsumentenprodukt für den<br />

Massenmarkt heraus.<br />

Spracherkennungsprodukte von Learnout & Hauspie sind nun auch in deutscher Sprache<br />

verfügbar.<br />

Tabelle 6: Zeitlicher Abriss der Entwicklungen auf dem Gebiet der Spracherkennung<br />

6<br />

Ein Trigramm ist eine Wortkette bestehend aus drei Wörtern. Durch Untersuchung von Texten kann eine Liste<br />

ermittelt werden, die die Wahrscheinlichkeiten für das Auftreten verschiedener Trigramme enthält.<br />

7<br />

Wörter mit einer ähnlichen oder identischen Aussprache, aber unterschiedlicher Bedeutung (z.B. rein und<br />

Rhein)<br />

20

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!