18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

354 21. Robustheit und Adaption<br />

zu finden, fokussiert sich ein Großteil der Forschung auf wesentlich schwierigere<br />

Probleme wie das Erkennen spontaner Telefondialoge. Dies illustriert<br />

die Bedeutung, die der Problematik der Robustheit zugemessen wird.<br />

Zu den Verfahren, die am meisten zur Verbesserung der Robustheit<br />

beitragen, gehören verschiedene Methoden der Adaption. Hierbei gibt es<br />

zahlreiche Verfahren, die auf allen Ebenen eines Spracherkenners, von der<br />

Signalverarbeitung bis hin zur Nachbearbeitung der Hypothesen, eingesetzt<br />

werden. Im diesem Kapitel werden einige der wichtigeren vorgestellt.<br />

21.1 Sprecherabhängigkeit<br />

Die Fehlerraten für verschiedene Sprecher können mit dem selben Erkenner<br />

extrem stark variieren. Abb. 21.1 zeigt die Fehlerraten für die Sprecher 4t1<br />

bis 4tk der DARPA Wall Street Journal Evaluation vom Dezember 1994. Für<br />

jeden Sprecher sind die Fehlerraten mit allen Erkennern als Kreuze markiert.<br />

Abgesehen von der Schwankung der Fehlerraten für jeden einzelnen Sprecher<br />

ist erkennbar, daß die Fehler beim besten Sprecher, 4t3, zwischen ca. 2% und<br />

8% liegen, während die Fehler für den schwierigsten Sprecher, 4td, zwischen<br />

ca. 25% und 50% also etwa zehn mal so hoch liegen.<br />

Es gibt nun verschiedene Möglichkeiten, Erkenner auf einen bestimmten<br />

Sprecher zu adaptieren. Einige Eigenschaften, die einzelne Sprecher von<br />

anderen unterscheiden sind relativ leicht zu beschreiben, dazu gehören<br />

zum Beispiel die typische Sprechgeschwindigkeit, der gesprochene Dialekt<br />

oder Akzent, das Geschlecht und die damit verbundene Anatomie des<br />

Artikulationsapparates. Andere Eigenschaften sind wesentlich schwieriger<br />

zu beschreiben und sind fast nur in den Parametern der Spracherkenner<br />

wiederzufinden.<br />

Bereits erfolgreich eingesetzt wurden Verfahren, bei denen verschiedene<br />

Erkenner für verschiedene Gruppen von Sprechern trainiert wurden. Bei<br />

der Konstruktion von Multilingualen Erkennern sieh man es als selbstverständlich<br />

an, daß die erste naheliegende Vorgehensweise das Training<br />

von Sprachenabhängigen Erkennern ist, und das Training eines sprachenunabhängigen<br />

Erkenners erst danach folgt. Im grunde könnte man die gleiche<br />

Argumentation auch für Gruppen von Sprechern gelten lassen. Solange<br />

ausreichend viele Trainingsdaten für jede Gruppe zur Verfügung stehen,<br />

kann es sehr wohl von Vorteil sein, mehrere in sich homogene Gruppen<br />

zu definieren, die jeweils eine kleine Streuung für die HMM-Parameter zur<br />

Folge haben und so sehr gute ” scharfe“ Modell haben.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!