18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

234 14. Das akustische Modell<br />

Σ Σ Σ Σ<br />

Abb. 14.5. Verschiedene Ebenen der Parameterkopplung<br />

aus einem Lautsprecher kommen und so die getrennte Lokalisierung der<br />

Schallquellen durch das binaurale Hören nicht möglich ist. Nach dem heutigen<br />

Stand der Technik ist nicht abzusehen, daß maschinelle Spracherkenner<br />

ähnliche Leistungen bald auch erbringen können. Dennoch gibt es viele<br />

ähnliche Aufnahmesituationen, die etwas einfacher zu handhaben sind, bei<br />

denen zum Beispiel ein Sprecher und irgendwelche Hintergrundgeräusche<br />

sich überlagern. Wenn die Hintergrundgeräusche wesentlich weniger Energie<br />

enthalten als die zu erkennende Stimme, dann bieten oft Adaptionsmethoden<br />

(s. Kap. 21) gute Lösungen. Wenn die Energie der Hintergrundgeräusche<br />

jedoch in die Größenordnung der Energie der Sprache kommt, und wenn<br />

die Hintergrundgeräusche eine eigene Struktur haben, dann bietet sich eine<br />

Vorgehensweise an, die als Verwendung mehrdimensionaler Hidden-Markov-<br />

Modelle bezeichnet werden kann.<br />

Die bei solchen Modellen basiert auf der Annahme, daß alle (beide)<br />

Schallquellen Signale erzeugen, die durch ein Hidden-Markov-Modell modelliert<br />

werden können. Im einfachen Fall, würde ein HMM die Sprache<br />

und eines die Geräusche (Musik, Auto, Büro etc.) modellieren. Jedes HMM<br />

hat seine eigene Zustandsmenge. Die Forward-Backward- und Viterbi-<br />

Algorithmen können aber nicht unabhängig voneinander durchgeführt<br />

werden, weil die einzelnen Signale nicht isoliert vorliegen. Daher wird für<br />

sie ein Zustandsraum aufgebaut, der das kartesische Produkt der einzelnen<br />

Zustandsräume S (1) × S (2) ist. Wenn der Zustand s (1)<br />

i der i-te Zustand

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!