18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

14.6 Aussprachemodellierung 241<br />

werden, die die häufigsten Aussprachen bestimmter Wörter zu Tage treten<br />

läßt.<br />

Auswahl der Varianten<br />

Leider ist es nicht so, daß ein willkürliches Volladen des Aussprachelexikons<br />

mit vielen Varianten zum Erfolg führt. Das dabei entstehende Problem ist<br />

im folgenden illustriert:<br />

Sprecher meinte:<br />

” Nimm mal einen Hammer.“<br />

Sprecher sagte:<br />

” Nimm mal ’n’ Hammer.“<br />

Erkenner ohne Varianten:<br />

” Nimm mal Hammer.“<br />

In diesem Beispiel wurde das Wort einen“ – wie so oft – so schwach ar-<br />

”<br />

tikuliert, daß der Erkenner nichts Sinnvolles an dieser Stelle Erkennen konnte.<br />

Die erste Idee zur Beseitigung des Problems ist nun, das Aussprachelexikon<br />

so anzureichern, daß auch die Variante ’n’ als Aussprache für ” einen“<br />

darin vorkommt. Bei der Gelegenheit könnten dann auch gleich einige<br />

weitere Varianten hinzugefügt werden, so daß das Lexikon die folgenden<br />

zusätzlichen Einträge erhält:<br />

Wort Aussprache<br />

einen AI N E N<br />

einen AI N<br />

einen N<br />

haben-wir H A B N W IE R<br />

haben-wir H A M ER<br />

einmal AI N M A L<br />

einmal M A L<br />

Mit diesem angereicherten Lexikon sollte der Erkenner nun in der Lage<br />

sein, auch die Kurzversion des Wortes ” einen“ zu erkennen. Allerdings kann<br />

es auch vorkommen, daß sich die Situation jetzt so darstellt:<br />

Sprecher meinte:<br />

Sprecher sagte:<br />

Erkenner mit Varianten:<br />

” Nimm mal einen Hammer.“<br />

” Nimm mal ’n’ Hammer.“<br />

” einen im einmal einen haben wir.“<br />

Die Verwendung von zu vielen Varianten kann also auch kontraproduktiv<br />

sein und zu mehr Erkennungsfehlern führen. Insbesondere Varianten mit<br />

wenigen Phonemen können leicht als ” Lückenfüller“ bei der Erkennung<br />

von qualitativ schlechten Aufnahmen dienen. Wenn keines der langen<br />

Vokabularwörter auf ein Segment der Aufnahme mit ausreichender Wahr-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!