18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

17.2 Ballung von Kontexten 305<br />

Ein divisiver Ballungsalgorithmus kann also im allgemeinen wie folgt<br />

skizziert werden:<br />

1. initialisiere einen Ballungsknoten mit allen zu ballenden Modellen<br />

2. berechne für jeden Blattknoten und jede Frage aus dem Fragenkatalog<br />

den Gewinn einer Auftennung<br />

3. führe von allen Auftrennung die gewinnbringendste aus<br />

4. solange Abbruchkriterium nicht erfüllt, gehe zu 2<br />

Der Gewinn einer Auftrennung in Schritt 2 kann als Gewinn der Beobachtungswahrscheinlichkeit<br />

(Likelihood-Distanz) oder als Informatinsgewinn<br />

(Entropie-Distanz) berechnet werden. Auf jeden Fall ist es wichtig, hier die<br />

gewichtete Distanz (also Gl. 17.4 statt Gl. 17.3) zu verwenden. Bei einer<br />

ungewichteten Distanz kann sich herausstellen, daß eine Auftrennung von n<br />

Modellen in (n − 1) : 1 (sofern es Fragen im Katalog gibt, die dies erlauben)<br />

am gewinnbringendsten ist, nur weil eines der Modelle eine Art Ausreißer<br />

ist. Die Folge wären entartete Kontextentscheidungsbäume mit geringer<br />

Breite und großer Tiefe. Grundsätzlich ist zu beobachten, daß die Gewinne<br />

mit wachsender Tiefe des Baumes abnehmen.<br />

Im Beispiel von Abb. 17.9 werden Kontexte verschiedener Phoneme in<br />

einem Modell zusammengelegt. Dies macht das Beispiel insofern unrealistisch,<br />

als eine gemeinsame Modellierung des Frikativs F und des Vokals O<br />

nicht sinnvoll ist. Sie sind offensichtlich viel mehr verschieden als gleiche<br />

Phoneme in verschiedenen Kontexten. Daher werden in der Spracherkennung<br />

normalerweise mehrere Kontextentscheidungsbäume erzeugt, zum Beispiel<br />

je ein Baum für jedes Phonem (Monophon) oder je ein Baum für jedes<br />

Subphonem. Die Wurzelknoten werden dann nur mit den verschiedenen<br />

Allophonen eines Phonems gefüllt, oder bei noch feinerer Aufteilung nur mit<br />

den gleichen Segmenten (Beginn, Mitte, Ende) der Allophone eines Phonems.<br />

Auf diese Art wird Wissen in den Ballungsalgorithmus gesteckt, das diesem<br />

zum einen die Arbeit erleichetrt, weil dann kleinere Bäume entstehen und<br />

weniger Entscheidungen getroffen werden müssen, zum anderen aber auch<br />

einige Freiheiten nimmt, akustische Phänomene gemeinsam zu modellieren.<br />

Es mag zwar einige Fälle geben, in denen Teile verschiedener Phoneme<br />

sogar sinnvollerweise zusammengelegt werden könnten, zum Beispiel das<br />

Ende des Affrikatsñ(erstes Phonem im Wort ” Zaun“) mit einem Segment<br />

des Frikativs s. Allerdings hat die Praxis gezeigt, daß die seltenen<br />

Fälle, in denen so etwas sinnvoll wäre den zusätzlichen Aufwand nicht lohnen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!