18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

364 21. Robustheit und Adaption<br />

Parameter durchgeführt wird.<br />

sprecherunabhängiger<br />

Erkenner<br />

Sprecher 1<br />

Viterbi-<br />

Pfad<br />

Sprecher 2<br />

Viterbi-<br />

Pfad<br />

St .<br />

Sprecher n<br />

Viterbi-<br />

Pfad<br />

Abb. 21.3. Label-Boosting Verfahren<br />

MLLR1<br />

MLLR2<br />

MLLRn<br />

Viterbi-<br />

Pfad<br />

Viterbi-<br />

Pfad<br />

Viterbi-<br />

Pfad<br />

sprecherunabhängiger<br />

Erkenner<br />

St+1<br />

In jeder Iteration werden zunächst für jeden Sprecher j Pfade (Labels)<br />

dieses Sprechers aus der letzten Iteration verwendet um mit ihrer Hilfe<br />

die MLLRj Transformation auf den Sprecher j zu berechnen. Mit den so<br />

transformierten HMM-Parametern werden dann neue bessere Viterbi-Pfade<br />

berechnet. Erst die neuen Pfade beziehungsweise die daraus resultierenden<br />

γt(i) werden dann von Baum-Welch Trainingsalgorithmus zur Schätzung der<br />

neuen Parameter St+1 verwendet.<br />

21.5.3 SAT<br />

Während beim Label-Boosting für jeden Sprecher zwar eine eigene MLLR-<br />

Transformation berechnet wird, so findet dennoch keine Normierung in<br />

dem Sinne statt, daß versucht würde die Variationen zwischen den Sprechern<br />

auszugleichen. Dies ist Ziel des so genannten sprecheradaptiven<br />

Trainings (SAT). Dabei werden alle HMM-Parameter mit einer für alle<br />

Sprecher oder Sprechergruppen gemeinsamen Transformation adaptiert.<br />

Ähnlich wie beim Label-Boosting werden auch beim SAT sprecherabhängige<br />

MLLR-Transformationen basierend auf sprecherabhängigem EM-Training<br />

und mit vom Sprecher j abhängigen HMM-Parametern λ (j)<br />

i berechnet.<br />

In einem Synchronisierungsschritt wird aber aus allen sprecherabhängigen<br />

MLLR-Transformationen eine globale Transformation berechnet, die dann

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!