18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

248 15. Erkennung kontinuierlicher Sprache<br />

zusätzlich entstehen, und einige Lösungen für diese vorgestellt.<br />

15.1 Bewertung von Erkennungshypothesen<br />

Die Bewertung der Leistung eines Einzelworterkenners ist recht einfach.<br />

Wenn die Testmenge aus n Wörtern besteht und der Erkenner c Wörter<br />

korrekt erkennt, kann man seine Worterkennungsrate WCR (word correct<br />

rate) angeben als<br />

WCR = c<br />

· 100% (15.1)<br />

n<br />

Beim Erkennen von kontinuierlicher Sprache ist dies nicht mehr so selbstverständlich.<br />

Wie würde man die Worterkennungsrate angeben, wenn der<br />

Sprecher ” Erkenner“ spricht und der Erkenner ” der Kenner“ erkennt, und<br />

wie wenn ” der Erkenner“ erkannt wird. Zweifellos wäre es nicht angebracht,<br />

bei der Fehlerkennung ” der Erkenner“ zu sagen, daß 100% der gesprochenen<br />

Wörter richtig erkannt wurden und somit die Worterkennungsrate 100%<br />

beträgt. Außerdem wäre es wünschenswert, daß ein Qualitätsmaß die<br />

Hypothese ” wer erkennt er“ schlechter bewertet als die Hypothese ” erkennt“<br />

obwohl in beiden Fällen kein einziges Wort richtig erkannt wurde.<br />

In der kontinuierlichen Spracherkennung wurden verschiedene Qualitätsmaße<br />

eingesetzt, wirklich etabliert hat sich aber nur eins, das drei<br />

Fehlerarten kennt, nämlich<br />

• Vertauschungen: z.B.<br />

• Einfügungen: z.B.<br />

• Auslassungen: z.B.<br />

→<br />

→<br />

→<br />

” Guten Tag Herr Müller.“<br />

” Guten Tag wer Müller.“<br />

” Guten Tag Herr Müller.“<br />

” Guten Tag der Herr Müller.“<br />

” Guten Tag Herr Müller.“<br />

” Guten Tag Müller.“<br />

Diese Art der Fehler erinnert stark an die Arten der Editierschritte, wie<br />

sie im Abschnitt 11.1 definiert wurden, und ebenso wie es zwischen zwei<br />

Texten eine minimale Editierdistanz gibt, gibt es bei zwei Wortfolgen eine<br />

minimale Fehlerzahl bestehend aus den o.a. Fehlern. Wenn der Satz ” Guten<br />

Tag Herr Müller.“ mißverstanden wird als ” Ja guten Tal Müller“, dann kann

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!