18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

20.2 Erkennung beliebiger Namen 349<br />

heraus, daß gerade das Falscherkennen oder Nichterkennen von Eigennamen<br />

zwar selten aber dafür umso ärgerlicher ist. Wenn gelegentlich der Kasus<br />

eines Artikels nicht richtig erkannt wird (dem statt den), so hat das meistens<br />

keine negativen Konsequenzen, der Satz kann immer noch richtig verstanden<br />

und übersetzt werden, die Reaktion des Gesamtsystems fällt immer noch zur<br />

Zufriedenheit des Benutzers aus. Wenn aber ein Eigenname (Person, Ort,<br />

Firma, Ereignis, etc.) falsch erkannt wird, ist ein korrektes Verstehen meist<br />

gar nicht möglich.<br />

Bei der Behandlung von unbekannten Wörtern gibt es zwei wesentliche<br />

Probleme zu lösen: Zum einen muß der Erkenner detektieren, daß an<br />

einer bestimmten Stelle ein unbekanntes Wort wahrscheinlich ist, und zum<br />

anderen muß er dann an dieser Stelle ein Wort hypothetisieren, das nicht in<br />

seinem Vokabular vorhanden ist.<br />

Die Detektion des Vorhandenseins eines Wortes außerhalb des Erkennervokabulars<br />

(OOV-Wort) kann auf unterschiedliche Art geschehen. In der<br />

Regel wird ein Detektor nicht nur eine binäre Entscheidung treffen, sondern<br />

eine bestimmte Wahrscheinlichkeit dafür schätzen, daß an einer Stelle der<br />

Hypothese ein OOV-Wort steht.<br />

Die naheliegendste Methode für solche Schätzungen ist die direkte Verwendung<br />

einer OOV-Sprachmodellklasse. Meist werden beim Berechnen von<br />

Sprachmodellen mit Hilfe großer Textkorpora selten beobachtete Wortfolgen<br />

als sogenanntes Discounting nicht explizit geschätzt. In vielen Fällen werden<br />

nicht nur ganze Wortfolgen, sondern sogar selten vorkommende Wörter –<br />

egal in welchem Kontext – überhaupt nicht modelliert. Wenn diese Wörter<br />

im Trainingstext für das Sprachmodell durch ein spezielles Wort, z.B.<br />

” OOV“, ersetzt werden, und nicht in das Vokabular des Erkenners aufgenommen<br />

werden, dann berechnet das Sprachmodell die Wahrscheinlichkeit,<br />

daß OOV“ an einer bestimmten Stelle auftritt. Diese Wahrscheinlichkeit<br />

”<br />

ist im Grunde schon relativ gut geschätzt, und weitere Informationsquellen<br />

scheinen nicht nötig zu sein, insbesondere wenn man bedenkt, daß bei vielen<br />

Erkennungsaufgaben die Wahrscheinlichkeit, ein OOV-Wort zu beobachten,<br />

sowieso ziemlich klein ist. Weitere Informationsquellen können aus dem akustischen<br />

Modell kommen. Typischerweise würde man erwarten, daß an einer<br />

Stelle der Hypothese, an der die Wahrscheinlichkeiten, die das akustische<br />

Modell für ein Wort liefert, wesentlich höher ist als die Wahrscheinlichkeiten<br />

für alle anderen Wörter, der Erkenner viel sicherer, d.h. konfidenter, ist als<br />

an einer Stelle, an der viele verschiedene Wörter eine Wahrscheinlichkeit<br />

ähnlich der besten Wahrscheinlichkeit haben. An solchen Stellen niedriger<br />

Konfidenz ist eher anzunehmen, daß ein OOV-Wort vorliegt, als an Stellen<br />

hoher Konfidenz.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!