18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

24 2. Eigenschaften und Taxonomie von Sprache und Spracherkennern<br />

In Abb. 2.1 ist die durchschnittliche (über die einzelnen Teilnehmer der<br />

DARPA Evaluation gemittelte) Wortfehlerrate auf den Wall Street Journal<br />

Daten von 1994 in Abhängigkeit von der Sprechgeschwindigkeit aufgetragen.<br />

Man erkennt nicht nur, daß die Fehlerrate bei sehr hohen Sprechgeschwindigkeiten<br />

dramatisch ansteigt. Auch bei besonders langsamer Sprechweise<br />

treten mehr Fehler auf als bei der mittleren Geschwindigkeit. Vergleichbare<br />

Beobachtungen werden bei Spracherkennern immer wieder gemacht. Je<br />

mehr die Testbedingungen vom Durchschnitt abweichen, umso schwieriger<br />

ist die Erkennung. Bei erhöhter Sprechgeschwindigkeit kommt zusätzlich<br />

zu der schlechten Übereinstimmung der Trainings- und Testdaten noch die<br />

Problematik hinzu, daß beim schnellen Sprechen viel öfter einzelne Laute<br />

extrem kurz und verfälscht ausgesprochen werden oder schlimmstenfalls<br />

sogar ganz ausgelassen werden.<br />

2.4 Erkennungsszenario<br />

Je kompakter das Szenario ist, umso wahrscheinlicher ist es, daß ein guter<br />

Erkenner dafür gebaut werden kann. Dies hängt zum einen damit zusammen,<br />

daß das Vokabular eines kompakten Szenarios kleiner ist, zum anderen damit,<br />

daß die Menge der verwendeten Sprachkonstrukte und Wortfolgen auch klein<br />

ist. Durch ein Szenario wird eine Erwartung vorgegeben. Erkennung bedeutet<br />

Vergleichen der aufgenommenen Sprache mit möglichen Erwartungen. Je<br />

kleiner die Menge der Erwartungen, umso weniger wahrscheinlich ist eine<br />

Verwechslung.<br />

2.5 Perplexität<br />

Auch wenn wir den Begriff der Perplexität erst in Kapitel 16 formal<br />

definieren, so wollen wir ihn doch schon hier verwenden. Zunächst genügt<br />

es zu wissen, daß die Perplexität ein Maß dafür ist, wie viele Wörter<br />

ein Erkenner im Schnitt gleichzeitig erkennen können muß. Eine niedrige<br />

Perplexität bedeutet, daß nur wenige Wörter zu einem Zeitpunkt<br />

zu unterscheiden sind, was bedeutet, daß die Erkennungsaufgabe leicht<br />

ist. Eine hohe Perplexität heißt, daß die Verwechslungsgefahr höher ist<br />

und damit auch die Fehlerwahrscheinlichkeit und die Schwierigkeit der<br />

Erkennungsaufgabe. So ist es zum Beispiel wesentlich einfacher, von einem<br />

Arzt diktierte Diagnosen zu erkennen, als den Name einer Person, die sich<br />

vorstellt. Während die Sprache von ärztlichen Diagnosen relativ uniform<br />

ist und an einer Stelle nur wenige verschiedene Wörter erwarten läßt,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!