18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

296 17. Kontextabhängige akustische Modelle<br />

Auf den ersten Blick hat man den Eindruck, daß es von Vorteil sein<br />

müßte relativ große Kontextbreiten zu berücksichtigen, weil auch für diese<br />

immer noch neue Polyphone dazukommen. Andererseits sollte man auch<br />

berücksichtigen, wieviele Trainingsdaten man für diese zur Verfügung hat.<br />

Abb. 17.4 trägt auf der Ordinaten auf, wie viele Polyphone es gibt, die<br />

in den WSJ-Trainingsdaten x mal beobachtet werden. Auf den ersten<br />

Blick fällt auf, daß die häufigste Beobachtungszahl die 1 ist. Je größer die<br />

Beobachtungszahl ist umso weniger Polyphone gibt es, die so oft vorkommen.<br />

Diese Eigenschaft verschärft sich umso mehr, je breiter der Kontext gewählt<br />

wird. Bei einer Kontextbreite von ±1 gibt es ca. 7400 Polyphone, die nur<br />

ein einziges Mal in den Trainingsdaten vorkommen, bei einer Kontextbreite<br />

von ±5 sind es schon ca. 50000. Bei sehr breiten Kontexten gibt es also sehr<br />

viele Polyphone die zu selten vorkommen, um ausreichend robust modelliert<br />

werden zu können.<br />

Anzahl Polyphone mit gegebener Beobachtungshäufigkeit<br />

100000<br />

△⋆<br />

△⋆<br />

× ×<br />

△⋆<br />

×<br />

△⋆<br />

× △⋆<br />

×<br />

⋆<br />

× ⋆<br />

△△△△△△<br />

⋆<br />

10000<br />

+ + + + +<br />

1000<br />

⋆⋆⋆⋆⋆⋆⋆⋆<br />

⋆⋆⋆<br />

⋆ ×××××××<br />

100<br />

△ ×××<br />

Kontextbreite ±1 + ⋆⋆⋆<br />

△△<br />

Kontextbreite ±2 ×<br />

⋆ △<br />

△△ × ++++++<br />

Kontextbreite ±3 △ ⋆<br />

10<br />

⋆<br />

△×<br />

Kontextbreite ±5 ⋆<br />

△<br />

×<br />

⋆⋆<br />

1<br />

+<br />

×<br />

+<br />

⋆ ×<br />

⋆ △ × +<br />

1 10 100 1000 10000 100000<br />

Anzahl der Beobachtungen in den Trainingsdaten<br />

Abb. 17.4. Wieviele Polyphone gibt es, die x mal vorkommen?<br />

Die große Zahl der verschiedenen kontextabhängigen Modelle schon bei<br />

relativ kleinen Kontextbreiten erzwingt eine Zusammenfassung (Ballung)<br />

derselben in eine wesentlich kleinere und somit handhabbare Zahl an<br />

Modellklassen.<br />

+++

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!