18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

158 10. Erkennung statischer Sprachsignale<br />

denen der Codebücher verglichen und so klassifiziert.<br />

Sobald die Menge der zu erkennenden Klassen mehr als nur eine ” Handvoll“<br />

ist, versagen solche einfachen Spektrenvergleiche. Ähnlich schlecht funktionieren<br />

sie, wenn nicht nur statische Laute wie Vokale, sondern etwas kompliziertere<br />

Dinge wie kurze Lautfolgen erkannt werden sollen. Dies ist beim<br />

Buchstabieren der Fall. Die bereits mehrfach erwähnte B-D-G-Task ist ein<br />

Beispiel dafür. Anfang der Achtziger war die erfolgreichste Vorgehensweise<br />

bei dieser Beliebten Aufgabe die Analyse mehreren aufeinanderfolgender<br />

Kurzzeitspektren. In der Tat gehörten relativ einfach strukturierte neuronale<br />

Netze (Multi-Layer-Perzeptronen) zu den am besten funktionierenden Lösungen.<br />

Dabei wurden oft die Eingangsneuronen als ein Fenster zum Spektrogramm<br />

betrachtet, so daß n aufeinanderfolgende Kurzzeitspektren als jeweils<br />

d-dimensionale Filterbankvektoren in die n·d große Eingabeschicht der Netze<br />

geführt. Die Trainingsmethoden und Architekturfeinheiten wurden dann oft<br />

noch so modifiziert, daß die in der Dynamik des Signals liegende Besonderheit<br />

der Sprache berücksichtigt wurde (vgl. Kap. 22).

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!