18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

348 20. Erkennung von Spezialvokabular<br />

als minimierter Automat.<br />

Wenn die Benutzerschnittstelle so gestaltet ist, daß das System weiß,<br />

wann der Sprecher Buchstabierfolgen eingibt, kann ein isoliertes System<br />

mit einem Automaten wie in Abb. 20.2 direkt auf der Aufnahme eingesetzt<br />

werden. Dies wurde zum Beispiel in [?] für eine vollautomatische Telefonauskunft<br />

bzw. Telefonvermittlung mir sehr guter Erkennungsleistung gemacht.<br />

In vielen Anwendungen muß aber damit gerechnet werden, daß neben<br />

den Buchstabiersequenzen auch fließend gesprochene Wörter oder Phrasen<br />

auftreten, zum Beispiel: Mein Name ist Maier, M, A, I, E, R, ich wohne in<br />

”<br />

...“. Für solche Aufgaben genügt ein reiner Buchstabiererkenner nicht. Dann<br />

ist die beste Vorgehensweise eine Hintereinanderausführung von Erkennung<br />

mit einem kontinuierlichen Spracherkenner und einem spezialisierten Buchstabiererkenner<br />

[?]. Der Standard Spracherkenner erkennt dann im obigen<br />

Beispiel womöglich Mein Name ist Maier M ah Ihr R ich wohne in ...“. Mit<br />

”<br />

Hilfe von Konfidenzmaßen und eines Sprachmodells kann die Wortsequenz<br />

” M ah Ihr R“ als wahrscheinliche Buchstabierfolge identifiziert und der<br />

entsprechende Teil aus dem Sprachsignal herausgeschnitten werden, so daß<br />

der spezialisierte Buchstabiererkenner darauf die korrekte Buchstabenfolge<br />

erkennen kann. Ein Vergleich des Buchstabierhypothese mit der Hypothese<br />

des Standarderkenners kann am Ende noch zusätzliche Informationen liefern,<br />

die zur Entscheidung oder Revidierung, daß es sich um Buchstabieren<br />

handelt, verwendet werden können.<br />

20.2 Erkennung beliebiger Namen<br />

Lange Zeit wurde die Forschung auf dem Gebiet der Erkennung unbekannter<br />

Wörter vernachlässigt. Dies geschah vor allem deshalb, weil ein Großteil<br />

der Forschung auf englischer bzw. amerikanisch-englischer Sprache stattfand<br />

und immer noch stattfindet. Aufgrund der sehr wenigen Flexionen und<br />

sehr eingeschränkten Möglichkeiten der Komposition von Wörtern im<br />

Englischen genügen in der Regel wenige hunderttausend Wörter in einem<br />

Erkennervokabular um weit über 99% des Wörter der allermeisten Dokumente<br />

abzudecken. Von den nicht abgedeckten Wörtern sind die meisten<br />

Eigennamen, Abkürzungen oder seltene Symbolfolgen (z.B. Zahlen).<br />

Weil seit den achtziger Jahren fast ausschließlich die Wortfehlerrate als<br />

Maß für die Qualität eines Spracherkenners verwendet wurde, und weil dabei<br />

keine Unterscheidung gemacht wurde, welche Fehler schwerwiegender sind<br />

oder welche Fehler schwerwiegendere Konsequenzen für die nachgeschalteten<br />

Systeme wie Verstehen und Übersetzen haben, wurde auch wenig Energie in<br />

die Erkennung dieser OOV-Wörter investiert. In der Praxis stellt sich aber

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!