18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

erwartenden Wörter).<br />

2.9 Wie schwierig ist Spracherkennung 31<br />

In der obigen Liste beziehen sich die meisten Punkte auf die Komplexität<br />

der Aufgabe. Zweifelsohne war der Rechen- und Speicheraufwand lange Zeit<br />

ein die Forschung stark einschränkendes Kriterium. Selbst heute, da die Leistung<br />

gewöhnlicher verbreiteter Prozessoren um mehrere Größenordnungen<br />

über derer von 1971 liegt, wären wir nicht so weit, wie wir sind, wenn nicht<br />

schon damals viel Energie darin investiert worden wäre, Spracherkennung<br />

mit den wenigen zur Verfügung stehenden Ressourcen zu machen. Es ist<br />

auch heute nicht abzusehen, daß die Leistung von Standardrechnern so<br />

dramatisch zunehmen wird, daß ein ökonomischer Umgang mit Zeit und<br />

Speicherplatz nicht mehr wichtig wäre.<br />

Dennoch kann man sagen, daß der größte Teil der Probleme der Spracherkennung<br />

nicht von der Komplexität sondern eher von der Variabilität<br />

kommt. Es ist so, daß aus den wenigen Bits pro Sekunde, die im Gehirn<br />

eines <strong>Mensch</strong>en entstehen, um eine Nachricht zu formulieren, schließlich<br />

eine Folge von typischerweise 256000 Bits pro Sekunde wird (s. Abb. 2.2).<br />

Ohne bedeutenden Informationsverlust, lassen sich diese 256 KBit um<br />

ca. 90% reduzieren. Diese Datenflut läßt sich relativ einfach und schnell<br />

verarbeiten. In einem Bruchteil der Zeit, in der die Daten anfallen, werden sie<br />

verarbeitet und in komprimierter Form dem eigentlichen Erkenner zugeführt.<br />

Technisches Gegenstück<br />

Sprachgenerierung<br />

gedruckter Text<br />

(50 bps)<br />

Phonemfolgen/Prosodie<br />

Formulierung<br />

der Nachricht<br />

(200 bps)<br />

diskret<br />

Codierung<br />

mit Sprache<br />

kontinuierlich neuromuskuläre<br />

Aktionen<br />

artikulatorische<br />

Bewegungsparameter<br />

(2000 bps)<br />

Schallquelle<br />

Stimmbänder<br />

Sprecher<br />

Artikulattionsapparat<br />

(30000 bps)<br />

Datenübertragung<br />

Abb. 2.2. Elemente der Sprachkommunikation<br />

Sprachverstehen<br />

Verstehen<br />

der Nachricht<br />

Sprachdekodierung<br />

Neuroübertragung<br />

Basilarmembran<br />

Zuhörer<br />

Bedeutung/Semantik<br />

Phoneme, Wörter,<br />

Sätze, Prosodie<br />

diskret<br />

kontinuierlich<br />

Merkmalsextraktion<br />

Spektralanalyse

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!