18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

17.2 Ballung von Kontexten 299<br />

mit Likelihood-Distanz verfolgt das gleiche Ziel, wie das Baum-Welch Trainingsverfahren<br />

für HMMs, nämlich die Maximum-Likelihood Optimierung<br />

der Beobachtungswahrscheinlichkeit aller Trainingsdaten. Die Likelihood-<br />

Distanz zweier Klassen C1 und C2 ist definiert als:<br />

PC1(B1) · PC2(B2)<br />

PC1∪C2(B1 ∪ B2)<br />

(17.5)<br />

wobei PQ(R) die Beobachtungswahrscheinlichkeit der Trainingsdaten R<br />

gemessen mit dem Modell Q ist. Jede Vereinigung zweier Klassen hat eine<br />

Verkleinerung der Beobachtungswahrscheinlichkeit zur Folge. Der Ballungsalgorithmus<br />

mit Likelihood-Distanz sieht also zwei Verteilungen als ähnlich<br />

and, wenn ihre Vereinigung zu einem kleinen Wahrscheinlichkeitsrückgang<br />

führen würde.<br />

17.2.2 Ballungsalgorithmen<br />

Ballungsalgorithmen lassen sich in zwei verschiedene Gruppen einteilen:<br />

agglomerative und divisive. Agglomerative Verfahren beginnen mit vielen<br />

Klassen mir jeweils einzelnen Elementen und vereinigen in jedem Schritt<br />

zwei Klassen zu einer größeren Klasse (s. Abb. 17.5). Divisive Verfahren<br />

beginnen mit einer einzigen Klasse mit allen Elementen und teilen in jedem<br />

Schritt eine Klasse in zwei Unterklassen auf (s. Abb. 17.6).<br />

Abb. 17.5. Agglomerative Ballung

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!