18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

318 18. Effiziente Decodierverfahren<br />

reinen Viterbi-Algorithmus kann in einem Zustand der DTW-Matrix derartige<br />

Information nur schwer abgelegt werden, weil ein Zustand gleichzeitig<br />

in vielen verschiedenen Hypothesen enthalten sein kann. Die weitreichende<br />

Information kann dann bei Stack Decodern dafür verwendet werden sehr<br />

hilfreiche Entscheidungen zur Beschneidung des Suchraums zu treffen. Ein<br />

anderer Vorteil ist die leichte Extraktion von n-besten Listen. Wenn mehr<br />

als nur die Wahrscheinlichste Hypothese benötigt wird, dann stehen diese im<br />

Stapel direkt zum Auslesen bereit. Beschneidung des Suchraumes bedeutet<br />

bei Stack Decodern, daß einige Hypothesen aus den Stapel unten heraus<br />

fallen. Die Größe des Stapels ist beschränkt, und so wird dieser schon bei<br />

einem kleinen durchschnittlichen Verzweigungsgrand beim Expandieren von<br />

Hypothesen schnell gefüllt.<br />

In der Praxis werden synchrone Decoder häufiger verwendet als asynchrone.<br />

Dies liegt zum einen an traditionellen Gründen und zum anderen<br />

daran, daß für synchrone Decoder viele effiziente Algorithmen existieren.<br />

18.2 Beschneidung des Suchraumes<br />

Alle Suchalgorithmen in der Spracherkennung für große Vokabulare haben<br />

gemeinsam, daß der Suchraum auf die eine oder andere Art eingeschränkt<br />

werden muß. Dies läuft im Endeffekt immer darauf hinaus, zu entscheiden,<br />

ob die Expansion eines Zustands durchgeführt werden sollte oder nicht.<br />

Beim Verzicht auf eine Expansion kann die Suche Fehler machen. Als<br />

Suchfehler wird der Fall bezeichnet, bei dem die wahrscheinlichste Hypothese<br />

eine geringere Wortfehlerrate hat als die von Algorithmus gefundene.<br />

Auch wenn eine Expansion eine noch so geringe Wahrscheinlichkeit im<br />

Folgezustand hätte, kann in der Regel nicht ausgeschlossen werden, daß<br />

aus dieser partiellen Hypothese am Ende doch die Beste wird. Um solche<br />

Fälle zu minimieren ist es wichtig, richtige Entscheidungen zu treffen. Diese<br />

Entscheidungen müssen nicht nur auf der kumulativen Wahrscheinlichkeit<br />

eines Zustands basieren. Es ist auch sinnvoll ein wenig Vorauszuschauen.<br />

Die sogenannte Lookahead-Technik berechnet sehr schnell eine Vorhersage<br />

über die Entwicklung der kumulativen Wahrscheinlichkeit einer partiellen<br />

Hypothese, indem es zum Beispiel Expansionen mit Hilfe einfacher und somit<br />

schnell zu berechnender Emissionswahrscheinlichkeiten bewertet. Andere<br />

Möglichkeiten der Vorausschau ist die Berechnung von Sprachmodellwahrscheinlichkeiten<br />

der Wörter in die Expandiert werden soll. Natürlich kosten<br />

diese Vorausschauen Zeit, wenn sie aber eine deutlich bessere Beschneidung<br />

des Suchraums ermöglichen, so kann die dadurch gesparte Zeit überwiegen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!