18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

326 18. Effiziente Decodierverfahren<br />

L<br />

E<br />

F<br />

P<br />

A<br />

Abb. 18.10. Ein aus phonetischer Sicht sehr unwahrscheinlicher Pfad<br />

Die Faktoren, die die ” Aufenthaltsdauer“ einer Hypothese in einer<br />

Spracheinheit (zum Beispiel einem HMM-Zustand) beeinflussen, sind die<br />

Übergangswahrscheinlichkeiten und in noch größerem Maße die Emissionswahrscheinlichkeiten.<br />

Ignoriert man den Einfluß der Emissionswahrscheinlichkeiten<br />

und ist p die Wahrscheinlichkeit für einen Übergang aus einem<br />

HMM-Zustand zu sich selbst, dann verhält sich die Wahrscheinlichkeit für eine<br />

Aufenthaltsdauer von t Zeittakten exponentialverteilt gemäß (1 − p)p t−1 .<br />

Zweifellos reflektiert dies nicht in den meisten Fällen nicht die tatsächliche<br />

Verteilung. Eine explizite Längenmodellierung kann allerdings realisiert werden,<br />

indem für jede zu modellierende Spracheinheit (Zustand, Phonem, Wort)<br />

ein Längenhistogramm auf den Trainingsdaten geschätzt wird. Beim Expandieren<br />

eines Endzustandes einer Spracheinheit wird dann ein Strafterm zur<br />

kumulativen Wahrscheinlichkeit hinzugerechnet, der sich aus der Verweildauer<br />

und dem entsprechenden Histogrammwert ergibt [?].<br />

18.7 Mehrpaßsuchen<br />

Ähnlich wie es beim Forward-Backward-Algorithmus einen Vorwärtsund<br />

einen Rückwärtsdurchgang gibt, kann diese Idee auch auf die Suche<br />

übertragen werden. Auch wenn wir bei der Suche andere Motive haben,<br />

so gibt es durchaus auch hier gute Gründe mehrere Durchläufe durch die<br />

Aufnahme zu machen. Mitte der neunziger Jahre war es eine Art ” Running<br />

Gag“ bei den alljährlichen SLT-Workshops zu sagen, daß der Erkenner<br />

des Forschungslabors der US-Firma BB&N bei jeder DARPA-Evaluationen<br />

einen Durchgang (engl. pass) mehr als im Jahr davor hatte. Teilweise wurden<br />

Erkenner mit bis zu sechs Durchläufen vorgestellt.<br />

Grundsätzlich gibt es keinen Grund anzunehmen, daß in einem zweiten<br />

Durchgang Informationen gewonnen werden, die nicht auch schon im ersten<br />

Durchgang hätten gewonnen werden können. Die Frage ist nur, wieviel<br />

Aufwand dies macht. Und so kann es sich sehr wohl lohnen, in einem ersten<br />

besonders schnellen Durchlauf Informationen zu sammeln, die zwar nicht<br />

unmittelbar zu einer besseren Hypothese führen, aber mit deren Hilfe es

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!