18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

232 14. Das akustische Modell<br />

Signalverarbeitungsmethoden verwenden. Die größten Unterschiede findet<br />

man in der Art wie die Parameter gekoppelt werden [?].<br />

Eine für die Qualität eines Spracherkenners entscheidende Frage ist also<br />

die Frage danach, welche Phänomene aus der ” realen Welt“ mit einem<br />

eigenen Modell in der Modellwelt modelliert werden. Dabei gilt es, zwei Dimensionen<br />

zu beachten. Die eine ist die Dimension der zeitlichen Ausbreitung<br />

eines Modells, die andere die der merkmalsräumlichen Ausbreitung. Unterschiedliche<br />

zeitliche Ausbreitungen können sich dadurch manifestieren, daß<br />

entweder Modell für kurze Einheiten wie z.B. Phoneme oder deren Untereinheiten<br />

gebildet werden, oder für längere Einheiten wie z.B. Silben oder gar<br />

Wörter. Bei der Frage, welche Ausbreitung im Merkmalsraum die Modelle<br />

haben, kann man zwischen sehr spezifischen Modellen, wie z.B. einer ganz<br />

bestimmten Ausprägung eines Phonems, und sehr groben Modellen, wie z.B.<br />

Klassen von Phonemen (vgl. Kap. 6) unterscheiden. Tab. 14.1 und Tab. 14.2<br />

fassen die Vor- und Nachteile unterschiedlicher Spracheinheiten zusammen.<br />

Zeitliche<br />

Ausdehnung Vorteile Nachteile<br />

kurz hohe Flexibilität wenig Evidenz im Sprachsignal<br />

Domänenunabhängigkeit ⇒ hohe Verwechselbarkeit<br />

lang hohe Erkennungsrate wenig Trainingsdaten pro Einheit<br />

Tabelle 14.1. Vor- und Nachteile verschiedener zeitlicher Ausdehnung von<br />

Spracheinheiten<br />

Zeitlich kurze Einheiten (Phoneme) haben den Vorteil, daß sich aus ihnen<br />

sehr einfach längere Einheiten (Silben, Wörter) durch Konkatenation zusammensetzen.<br />

Würden Silben verwendet, wäre es schwierig beliebige Wörter<br />

(insbesondere Frendwörter) aus ihnen bauen. Der Nachteil kurzer Einheiten<br />

manifestiert sich in der geringeren Evidenz im Signal. Dadurch werden sie<br />

leichter verwechselbar als lange Einheiten. Den Vorteil der besseren Erkennungsgenauigkeit<br />

erkaufen sich lange Einheiten durch das Problem, daß sie<br />

seltener in den Trainingsdaten vorkommen und somit schwer trainierbar sind.<br />

Einheiten mit kleiner räumlicher Ausdehnung können durch eine relativ<br />

exakte Positionierung im Merkmalsraum gut beschrieben werden. Überla-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!