18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

18.7 Mehrpaßsuchen 327<br />

möglich ist, den Suchraum des zweiten oder der darauffolgenden Durchgänge<br />

so zu beschneiden, daß ein sehr großer Laufzeitgewinn bei fast keinen<br />

Suchfehlern erzielt werden kann. Dies funktioniert natürlich nur, wenn der<br />

zweite Durchlauf aufgrund seines aufwendigen Verfahrens bessere Ergebnisse<br />

liefert als der erste.<br />

Die gleichzeitige Verwendung von als Baumstruktur organisierten Modellachsen<br />

und weitreichender Sprachmodelle ist höchst kompliziert. Schon bei<br />

so einfachen Sprachmodellen wie Bigrammen (s. Abs. 18.3.1) ergeben sich<br />

Schwierigkeiten. Sollen sogar Trigramme oder noch breitere Sprachmodelle<br />

verwendet werden, hat dies zur Folge, daß für Teile der Modellachse Kopien<br />

angefertigt werden müssen (Details dazu gibt es in [?]), was sowohl speicherals<br />

auch zeitaufwendig ist. Insbesondere die Entscheidungen, welche Teile<br />

des Suchraums beschnitten werden sollten, können oft nur mit unzureichender<br />

Information getroffen werden, oder können bei Fehlentscheidungen zu<br />

großen Verlusten in der Erkennungsgenauigkeit führen. Daher bietet es sich<br />

an, eine dramatische Beschneidung des Suchraumes im Voraus auszuführen,<br />

dabei ein einfacheres Suchmodell zu verwenden (z.B. nur Bigramme und kontextunabhängige<br />

akustische Modelle) und dann im zweiten Durchgang das<br />

komplexe Suchmodell (z.B. mit Trigrammen und vielen kontextabhängigen<br />

akustischen Modellen) auf dem beschnittenen Suchraum wesentlich schneller<br />

auszuführen. Man kann also sagen, daß der erste schnelle Durchgang die sehr<br />

Hilfreiche Information zur Beschneidung des Suchraums des zweiten Durchgangs<br />

liefert. Diese Information kann (wie z.B. in [?] in Form einer Matrix<br />

vorliegen, die angibt, welche Wörter zu welchen Zeiten überhaupt in Frage<br />

kommen (s. Abb. 18.11). Das Infragekommen eines Wortes kann darauf basieren,<br />

daß ein Minimum der dem Wort zugehörigen HMM-Zuständen aktiv<br />

sind, d.h. im ersten Durchgang vom Suchalgorithmus besucht werden.<br />

wn<br />

.<br />

w4<br />

w3<br />

w2<br />

w1<br />

Abb. 18.11. Wortaktivitätsmatrix zur Beschneidung des Suchraumes<br />

t

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!