18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

302 17. Kontextabhängige akustische Modelle<br />

vorteilhaft wäre, es dorthin zu versetzen. Und für jedes Triphon des neuen<br />

Ballungsknotens muß geprüft werden, ob es vorteilhaft wäre, es in einen<br />

anderen Knoten zu versetzen. Die Anzahl der zu berechnenden Distanzen<br />

wächst also durch den Schritt 4 um ein Vielfaches an.<br />

Der obige Algorithmus kann auch zur Ballung anderer Einheiten als<br />

Triphone verwendet werden. In [?] wird berichtet, daß die Wortfehlerrate<br />

durch die Verwendung von Senones (vgl. Abb. 17.2) statt gesamter Triphone<br />

um ca. 20% reduziert werden konnte.<br />

17.2.4 Divisive Verfahren<br />

Sowohl divisive als auch agglomerative Verfahren haben ihre Nachteile.<br />

Das Problem bei den divisiven Verfahren ist die Frage, auf welche Art die<br />

Modelle eines Knotens in zwei Unterknoten aufgeteilt werden können. Das<br />

könnten schließlich bei einem Knoten mit n Elementen immerhin 2 n mögliche<br />

Aufteilungen sein. Der Nachteil der agglomerativen Verfahren wiegt aber<br />

viel schwerer: nämlich die Vokabularabhängigkeit. Gehen wir beispielsweise<br />

davon aus, daß in den Trainingsdaten die Phonemtripel p1 p0 p2, p3 p0 p4,<br />

p5 p0 p6 und p7 p0 p8 vorkommen und dies alle Kontexte sind, in denen p0<br />

gesehen wird. Durch den Ballungsalgorithmus werden die Tripel p1 p0 p2 und<br />

p3 p0 p4 zu dem verallgemeinerten Modell m1 und die Tripel p5 p0 p6 und<br />

p7 p0 p8 zu dem Modell m2 zusammengelegt (Abb. 17.8).<br />

p1 p0 p2 p3 p0 p4 p5 p0 p6 p7 p0 p8<br />

m1<br />

Abb. 17.8. Agglomerative Ballung kann zu Vokabularabhängigkeit führen<br />

Das heißt, es gibt zwei verschiedenen Modelle, mit denen das Phonem<br />

p0 modelliert werden kann. Je nach Kontext entweder mit m1 oder m2.<br />

In den Testdaten könnten nun Wörter vorkommen, die es im Training<br />

nicht gab, und in einem Wort könnte das Phonem p0 im Kontext p2 p0 p5<br />

auftauchen. Die Fragen, welches der beiden vorhandenen Modelle für diesen<br />

Kontext besser geeignet ist, läßt sich auf Anhieb nicht beantworten. Zur<br />

m2

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!