18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

17.2 Ballung von Kontexten 301<br />

Lee verwendete einen rein semikontinuierlichen HMM-Spracherkenner mit<br />

drei Datenströmen (Cepstren, Delta-Cepstren und Energie). Da jedes Triphon<br />

mit drei HMM-Zuständen modelliert wurde, bestanden die Parameter<br />

einer zu ballenden Einheit s aus neun diskreten Wahrscheinlichkeitsverteilungen<br />

γs,1 . . .γs,9. Als Distanzmaß verwendete Lee die Summe des<br />

Entropieanstiegs, der sich durch das Zusammenlegen zweier Ballungsknoten<br />

q und r zu s ergibt:<br />

D(q, r) =<br />

9 <br />

nq · H(γq,d) + nr · H(γr,d) − ns · H(γs,d) <br />

d=1<br />

(17.6)<br />

wobei ni die Anzahl der Trainingsdaten des Knotens i ist, und H(γ) die<br />

Entropie der Verteilung γ darstellt.<br />

Lees Ballungsalgorithmus sah wie folgt aus: 1<br />

1. initialisiere jeden Ballungsknoten mit einem Triphon<br />

2. berechne paarweise Distanzen zwischen allen Knoten<br />

3. vereinige die beiden Knoten mit der kleinsten Distanz<br />

4. a) berechne für jedes Triphon den Informationsgewinn, der durch<br />

Versetzen desselben in einen anderen Knoten entsteht<br />

b) falls durch Versetzen Gewinn erzielt werden kann, führe die<br />

Versetzung aus und gehe zu 4a<br />

5. solange Endekriterium nicht erfüllt, gehe zu 2<br />

Der Schritt 4 ist nötig, um optimale Leistung zu erzielen. Wird er weggelassen,<br />

fällt die Erkennungsrate des resultierenden Erkenners signifikant ab.<br />

Es ist allerdings genau dieser Schritt, der den Algorithmus sehr aufwendig<br />

macht. Der Schritt 2 ist nur zu Beginn des Algorithmus aufwendig. Später<br />

müssen immer nur die noch nicht berechneten Distanzen berechnet werden,<br />

das heißt die Distanzen zwischen dem gerade neu erzeugten Ballungsknoten<br />

und den anderen Knoten. Im Schritt 4a muß für jedes einzelne Triphon,<br />

das nicht zum neu erzeugten Ballungsknoten gehört, getestet werden, ob es<br />

1 Er unterscheidet sich von dem Standardalgorithmus in [?] im wesentlichen nur<br />

im zusätzlich eingeführten Schritt 4.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!