Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
6. TESTS 45<br />
Menüpunkt Sphinx4 JLAB Microsoft SAPI<br />
Dialog Demo Speech Server Dictation Pad<br />
Musik 58,06 81,94 54,84<br />
Anrufe 69,17 81,67 89,17<br />
Spiele 68,89 88,19 95,56<br />
eMail 89,23 86,15 87,69<br />
Hauptmenü 78,18 94,55 90,91<br />
Durchschnitt 72,71 86,5 83,63<br />
Tabelle 6.5: Worterkennungsraten aller drei Anwendungen in Prozent<br />
relativ konstante Worterkennungsrate über alle Vokabulargrößen. Das zeigt das er auch bei größeren Vokabularen<br />
noch gut funktioniert. Außerdem liefert er im Durchschnitt das beste Ergebnis ab. Für den Test<br />
stand leider nur die Version 1.3.5 des JLab Sprachmodells zur Verfügung. Mit der verbesserten Version<br />
1.3.19 könnte noch einmal eine kleine Verbesserung erreicht werden. Durch eine Optimierung des<br />
Vokabulars kann auch die Häufigkeit von Verwechslungen reduziert und somit die Worterkennungsrate<br />
gesteigert werden. Dies stellt das größte Verbesserungspotenzial dar, da am Testvokabular nur Standardwerte<br />
eingestellt waren. Dictation Pad belegt mit einer durchschnittlichen Worterkennungsrate von<br />
83,63Prozent in diesem Abschnitt zunächst den zweiten Platz. Wenn man die einzelnen Werte betrachtet<br />
fällt allerdings sofort die besonders schlechte Wertung im Menüpunkt Musik auf. In Anbetracht der der<br />
Tatsache, das es bei diesem Menüpunkt um sehr lange Befehlswortgruppen handelte und der Erkenner<br />
mit einem viel größeren Vokabular umgehen musste, besteht jedoch eine besonders hohe Verwechslungsgefahr.<br />
Lässt man diesen Ausreißer einmal außer Betracht erreicht Dictation Pad eine durchschnittliche<br />
Worterkennungsrate von 90,83Prozent. Wenn man eine eigene Anwendung auf Basis des Speech API<br />
erstellt, kann man auch eigene Vokabulare anlegen. Dadurch können Verwechslungsfehler im Vergleich<br />
zum Dictation Pad erheblich reduziert werden.<br />
Die Ergebnisse dieser Tests zeigen, dass man JLAB und SAPI bezüglich der Worterkennungsrate in etwa<br />
gleich stark einordnen kann und ihre Ergebnisse durch angesprochenen Verbesserungen noch ausbauen<br />
kann. Sphinx hingegen erhält eine schlechtere Bewertung. Dabei ist besonders der negative Einfluss der<br />
Vokabulargröße auf die Worterkennungsrate ein Problem.