18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Räumliche<br />

14.5 Mehrdimensionale Hidden-Markov-Modelle 233<br />

Ausdehnung Vorteile Nachteile<br />

klein gute diskriminative wenig Trainingsdaten pro Einheit<br />

Fähigkeiten<br />

groß robust trainierbar schlechte Diskriminativität<br />

Tabelle 14.2. Vor- und Nachteile verschiedener räumlicher Ausdehnung von<br />

Spracheinheiten<br />

gerungen mit anderen Einheiten sind weniger wahrscheinlich als bei breiter<br />

ausgedehnten, somit ist die Unterscheidbarkeit (Diskriminativität) höher.<br />

Allerdings gibt es umso weniger Trainingsdaten pro Einheit, je kleiner ihr<br />

Anteil am Merkmalsraum ist. Räumlich große Einheiten haben entsprechend<br />

mehr Trainingsdaten und sind so robust trainierbar, allerdings ist die Wahrscheinlichkeit<br />

der Überlagerung mit anderen Einheiten im Merkmalsraum<br />

größer, womit die Diskriminativität sinkt.<br />

Abb. 14.5 illustriert verschiedene Möglichkeiten der Parameterkopplung.<br />

Auf oberster Ebene wird die Entscheidung getroffen, welche HMM-Zustände<br />

durch das gleiche ” akustische Atom“ modelliert werden. Wenn Gauß-<br />

Mischverteilungen verwendet werden, dann ist ein akustisches Atom durch<br />

eine Mixturgewichteverteilung definiert. Auf der nächst tieferen Ebene wird<br />

festgelegt, welche Mixturgewichteverteilung über welchen Codebüchern von<br />

Gauß-Verteilungen definiert ist. Hier sind grundsätzlich beliebige Kopplungsgrade<br />

– nicht nur die in Abs. 14.2.2 vorgestellten – realisierbar und<br />

werden auch in der Praxis realisiert. Kap. 17 wird darauf weiter eingehen.<br />

Auf unterster Ebene ist es des weiteren noch möglich, daß verschiedene<br />

Gauß-Mischverteilungen sich einige Parameter (z.B. - wie dargestellt -<br />

Kovarianzmatrizen) teilen.<br />

14.5 Mehrdimensionale Hidden-Markov-Modelle<br />

<strong>Mensch</strong>en haben die Fähigkeit, aus einem Stimmengewirr von zwei oder mehr<br />

gleichzeitig sprechenden Personen eine herauszuhören und zu verstehen. Dies<br />

geht sogar – wenn auch mit mehr Verständnisfehlern – wenn die Stimmen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!