18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

13.3 Trainingsparadigmen 219<br />

Das für Hidden Markov Modelle meist angewendete Trainingsverfahren,<br />

das Baum-Welch Training ist auf die Maximum-Likelihood Schätzung ausgelegt<br />

und ist a priori nicht geeignet für diskriminatives Training. Es läßt<br />

sich allerdings erweitern zu einem MMIE-Verfahren [?], wie im folgenden<br />

beschrieben:<br />

Bei der Maximum-Likelihood Schätzung ist das Ziel die Maximierung des<br />

Terms<br />

T<br />

Lλ = lnpλ(X(t)|H(t)) (13.4)<br />

t<br />

wobei H(t) das Transkript der t-ten Trainingsäußerung, oder genauer gesagt<br />

das dazu gehörige Markov Modell ist, und X(t) die Beobachtung, also<br />

die Folge der Merkmalsvektoren der t-ten Trainingsäußerung ist. Der Baum-<br />

Welch Algorithmus transformiert die Parameter λ so, daß garantiert werden<br />

kann, daß Lλ gegen ein lokales Maximum konvergiert. Mit Verwendung von<br />

Lλ berechnet der Baum-Welch Algorithmus beispielsweise die Übergangswahrscheinlichkeiten<br />

für die Iteration t + 1 als<br />

a t+1<br />

ij =<br />

<br />

at ∂L<br />

ij<br />

t λ<br />

∂aij<br />

k at ∂L<br />

ik<br />

t λ<br />

∂aik<br />

Beim MMIE-Training wird statt Lλ der Term Iλ Optimiert:<br />

Iλ =<br />

(13.5)<br />

T<br />

lnpλ(X(t)|H(t)) − lnpλ(X(t)|R) (13.6)<br />

t<br />

wobei R nicht das HMM, das der einen t-ten Äußerung entspricht,<br />

sondern das HMM, das den kompletten Suchraum enthält, wie es bei der<br />

Erkennung verwendet wird. Iλ drückt also nicht die Wahrscheinlichkeit für<br />

die Beobachtung der t-ten Äußerung bei bekannter Wortfolge, sondern das<br />

Verhältnis dieser Wahrscheinlichkeit zur entsprechenden Wahrscheinlichkeit<br />

ohne bekannte Wortfolge. Darin steckt der diskriminative Charakter dieses<br />

Verfahrens.<br />

Der interessierte Leser findet die Details zur Modifikation des Standard<br />

Baum-Welch Algorithmus für die Verwendung des MMIE-Kriteriums zum<br />

Beispiel in [?]. Dort werden Ergebnisse von Experimenten auf einer Buchstabieraufgabe<br />

vorgestellt, die eine Reduktion der Fehlerrate um ca. 8% enthalten.<br />

13.3.2 Trainieren ohne Transkriptionen<br />

Wie bereits im Kap. 9 besprochen, können Trainingsverfahren überwacht<br />

oder unüberwacht sein. In der Spracherkennung bedeutet das im Extremfall

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!