29.01.2014 Aufrufe

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6. TESTS 45<br />

Menüpunkt Sphinx4 JLAB Microsoft SAPI<br />

Dialog Demo Speech Server Dictation Pad<br />

Musik 58,06 81,94 54,84<br />

Anrufe 69,17 81,67 89,17<br />

Spiele 68,89 88,19 95,56<br />

eMail 89,23 86,15 87,69<br />

Hauptmenü 78,18 94,55 90,91<br />

Durchschnitt 72,71 86,5 83,63<br />

Tabelle 6.5: Worterkennungsraten aller drei Anwendungen in Prozent<br />

relativ konstante Worterkennungsrate über alle Vokabulargrößen. Das zeigt das er auch bei größeren Vokabularen<br />

noch gut funktioniert. Außerdem liefert er im Durchschnitt das beste Ergebnis ab. Für den Test<br />

stand leider nur die Version 1.3.5 des JLab Sprachmodells zur Verfügung. Mit der verbesserten Version<br />

1.3.19 könnte noch einmal eine kleine Verbesserung erreicht werden. Durch eine Optimierung des<br />

Vokabulars kann auch die Häufigkeit von Verwechslungen reduziert und somit die Worterkennungsrate<br />

gesteigert werden. Dies stellt das größte Verbesserungspotenzial dar, da am Testvokabular nur Standardwerte<br />

eingestellt waren. Dictation Pad belegt mit einer durchschnittlichen Worterkennungsrate von<br />

83,63Prozent in diesem Abschnitt zunächst den zweiten Platz. Wenn man die einzelnen Werte betrachtet<br />

fällt allerdings sofort die besonders schlechte Wertung im Menüpunkt Musik auf. In Anbetracht der der<br />

Tatsache, das es bei diesem Menüpunkt um sehr lange Befehlswortgruppen handelte und der Erkenner<br />

mit einem viel größeren Vokabular umgehen musste, besteht jedoch eine besonders hohe Verwechslungsgefahr.<br />

Lässt man diesen Ausreißer einmal außer Betracht erreicht Dictation Pad eine durchschnittliche<br />

Worterkennungsrate von 90,83Prozent. Wenn man eine eigene Anwendung auf Basis des Speech API<br />

erstellt, kann man auch eigene Vokabulare anlegen. Dadurch können Verwechslungsfehler im Vergleich<br />

zum Dictation Pad erheblich reduziert werden.<br />

Die Ergebnisse dieser Tests zeigen, dass man JLAB und SAPI bezüglich der Worterkennungsrate in etwa<br />

gleich stark einordnen kann und ihre Ergebnisse durch angesprochenen Verbesserungen noch ausbauen<br />

kann. Sphinx hingegen erhält eine schlechtere Bewertung. Dabei ist besonders der negative Einfluss der<br />

Vokabulargröße auf die Worterkennungsrate ein Problem.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!