18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

14.2 Der Parameterraum des Akustischen Modells 227<br />

Durchführung eines Viterbi- oder Forward-Backward-Algorithmus deutlich<br />

erhöht wird. Zum einen weil vermehrt Fließkommaoperationen berechnet<br />

werden müssen, zum anderen weil die Auswertung der Gaußverteilungen<br />

eines Codebuchs nicht von mehreren Modellen gemeinsam genutzt werden<br />

kann. In der Praxis stellt sich jedoch oft heraus, daß die ” bessere Qualität“<br />

der kontinuierlich berechneten Emissionswahrscheinlichkeiten viel bessere<br />

Möglichkeiten zur Beschneidung des Suchraumes (s. Kap. 18) bieten, und<br />

somit zwar teurere aber dafür wesentlich weniger Emissionswahrscheinlichkeiten<br />

berechnet werden müssen.<br />

Bis Ende der achtziger Jahre waren kaum Datenbasen verfügbar, die<br />

ausreichten, um sehr große Parameterräume für voll kontinuierliche HMM-<br />

Spracherkenner mit großen Vokabularen gut zu trainieren. Für solche Fälle<br />

bieten sich so genannte semikontinuierliche Hidden-Markov-Modelle an. Bei<br />

diesen hat jede Spracheinheit eine eigene Mischverteilung, aber alle Einheiten<br />

teilen sich dieselbe Menge Gauß-Verteilungen (s. Abb. 14.3).<br />

Abb. 14.3. Semikontinuierliches Modell (ein Codebuch, viele Mixturgewichtever-<br />

teilungen)<br />

Da der größte Teil der Parameter in einem voll kontinuierlichen HMM<br />

in den Mittelwerten und Kovarianzmatrizen der Gauß-Verteilungen steckt,<br />

kann durch Reduktion auf ein einziges Codebuch der Parameterraum<br />

drastisch verkleinert werden. Die wenigen verbleibenden Parameter können<br />

wesentlich robuster geschätzt werden. Selbstverständlich ist die Modellierung<br />

des Merkmalsraumes mit semikontinuierlichen Modellen nicht so fein wie<br />

mit voll kontinuierlichen. Allerdings bieten semikontinuierliche Systeme<br />

einen sehr sinnvollen Kompromiß zwischen guter Trainierbarkeit (da wenige<br />

Parameter) und feiner Modellierung (da kontinuierlicher Merkmalsraum).<br />

Üblicherweise verwenden semikontinuierliche Erkenner ein Codebuch mit<br />

wesentlich mehr Gauß-Verteilungen (zum Beispiel über 1 000 in [?]) als in<br />

den typischerweise zwischen 10 und 100 Verteilungen enthaltenden kleinen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!