18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

15.1 Bewertung von Erkennungshypothesen 249<br />

man sagen, daß die Hypothese drei Fehler enthält. Erstens wurde ein ” Ja“<br />

fälschlicherweise eingefügt, zweitens wurde ” Tag“ durch ” Tal“ ersetzt, und<br />

drittens wurde das ” Herr“ ausgelassen. Basierend auf dieser Art der Fehlermessung<br />

kann die Wortfehlerrate WER (word error rate) definiert werden als<br />

WER =<br />

s + d + i<br />

n<br />

· 100%, (15.2)<br />

wobei s die Zahl der Vertauschungen (substitutions), d die Zahl der<br />

Auslassungen (deletions), i die Zahl der Einfügungen (insertions) und n die<br />

Zahl der gesprochenen Wörter ist. Man sieht leicht, daß die Wortfehlerrate<br />

auch über 100% liegen kann, wenn z.B. statt ” Guten Tag Herr Müller“<br />

fälschlicherweise ” Ja Guter Tal der Meier“ erkannt wird. Dann werden bei<br />

vier gesprochenen Wörtern insgesamt fünf Fehler gemacht, also beträgt die<br />

Wortfehlerrate 125%.<br />

Die Messung der Wortfehlerrate erfolgt genau auf die gleiche Art mit<br />

einem Algorithmus des dynamischen Programmierens wie bei der Bestimmung<br />

der minimalen Editierdistanz. Ebenso wie bei der Editierdistanz ist<br />

auch bei der Wortfehlerrate das Minimum nicht eindeutig. So kann stets<br />

die Folge Auslassung/Vertauschung/Einfügung auch interpretiert werden als<br />

Einfügung/Vertauschung/Auslassung mit der gleichen Fehlerzahl.<br />

Neben der Wortfehlerrate wird auch oft die Worterkennungsrate WRR<br />

(word recognition rate oder word accuracy) verwendet. Hier gilt einfach:<br />

WRR = 100% − WER =<br />

n − s − d − i<br />

n<br />

· 100% (15.3)<br />

Die Worterkennungsrate kann durchaus negativ werden, wenn mehr<br />

Fehler gemacht werden, als Wörter gesprochen wurden.<br />

Selten findet man auch Referenzen auf die Wortkorrektrate WCR (word<br />

correct rate)für kontinuierliche Sprache:<br />

WCR =<br />

n − s − d<br />

n<br />

· 100%, (15.4)<br />

die niemals negativ werden kann. In wenigen Fällen ist die Angabe der<br />

WCR sinnvoll. Dieses Maße kann man leicht ad absurdum führen, indem<br />

ein Erkenner, der das gesamte Erkennervokabular vielfach hintereinander<br />

ausgibt, 100% WCR erreichen könnte obwohl er ein Vielfaches der gesprochenen<br />

Wörter an Fehlern gemacht hat.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!