18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

14.6 Aussprachemodellierung 237<br />

auszusprechende Text eine Folge von Lauten aus einem Lauteinventar<br />

zugewiesen. Parallel dazu werden außerdem für diese Laute Eigenschaften<br />

wie Betonung und Länge berechnet. In einer zweiten Phase werden die<br />

zu den Lautfolgen passenden Signalstückchen zu einem Gesamtsignal<br />

” zusammengeklebt“. Dabei werden noch diverse Glättungsmethoden und<br />

vor allem die prosodischen Eigenschaften (Sprechrhythmus und -melodie)<br />

berücksichtigt. Damit sich eine Frage auch als Frage anhört und der Ton<br />

am Ende des Satzes wie bei Fragen üblich nach oben geht, müssen bei<br />

guten Systemen auch die Interpunktionszeichen ausgewertet werden oder<br />

sogar eine eingebundene Verstehenskomponente verwendet werden, die die<br />

benötigten Informationen über die Satzstruktur liefert.<br />

Aber nicht nur für die Qualität der Sprachausgabe sind gute Aussprachelexika<br />

von Bedeutung. Selbstverständlich wird durch die Lexika<br />

auch das akustische Modell von Spracherkennern bestimmt. Weichen die<br />

Einträge im Lexikon stark von den tatsächlich gesprochenen ab, so hat<br />

dies zur Folge, daß beim Erkennen die berechneten Wahrscheinlichkeiten<br />

für verschiedene Wörter ” irreführend“ sind, und beim Trainieren Modelle<br />

mit einer großen Varianz entstehen, bzw. sehr ähnliche Daten aus<br />

den in Wirklichkeit gleichen Lauten auf verschiedene Modelle verteilt werden.<br />

So hat sich in der Praxis herausgestellt, daß die besten Erkennungsergebnisse<br />

unter Verwendung von Aussprachelexika erzielt wurden, die von<br />

Experten auf den Gebieten der Phonetik und der Spracherkennung manuell<br />

entwickelt wurden. Unerläßlich für ein gutes Funktionieren ist dabei auch<br />

die Auswahl mehrerer Aussprachevarianten für ein Wort.<br />

14.6.2 Neue Wörter einbinden<br />

In vielen Aufgaben, in denen Spracherkenner eingesetzt werden, ist das<br />

Vokabular nicht im voraus bekannt. Insbesondere Eigennamen von Personen,<br />

geographischen Entitäten, Firmen oder Ereignissen können nicht immer<br />

vorher bekannt sein. In diesen Fällen ist es interessant, automatisch –<br />

also ohne Hinzuziehen von menschlichen Experten – neue Wörter in das<br />

Aussprachelexikon aufzunehmen.<br />

Das Einbinden neuer Wörter ist eine eigene Teildisziplin der Spracherkennung<br />

für sich [?]. Da geht es einmal um die Detektion neuer Wörter, die<br />

Generierung einer Aussprache, das Hinzunehmen ins Sprachmodell und die<br />

Bestimmung geeigneter akustischer Modelle. Aus der Sicht des Akustischen<br />

Modells steht man zwei Herausforderungen gegenüber: der Bestimmung<br />

eines Eintrags im Aussprachelexikon und schließlich der Bestimmung der<br />

akustischen Atome für die HMM-Zustände. Bei völlig kontextunabhängigen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!