Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
10. GLOSSAR 67<br />
10 Glossar<br />
Erkennungsgeschwindigkeit<br />
Die Erkennungsgeschwindigkeit oder Echtzeitfaktor gibt an, wieviel schneller der Erkenner gegenüber<br />
der Dauer der gesprochenen Eingabe ist.<br />
Erkennungsraten<br />
Die Worterkennungsrate eines Spracherkenners bezeichnet wieviele Worte korrekt erkannt wurden. Ihr<br />
entgegen steht die Wortfehlerrate.<br />
Formanten<br />
Formanten sind die Frequenzanteile eines Signals, bei denen besonders viel Energie vorhanden ist. In<br />
Abbildung 10.1 ist das Spektrogramm eines Phonems zu sehen. Umso dunkler die Farbe desto höher ist<br />
der Energieanteil der entsprechenden Frequenz.<br />
NAD<br />
Die NAD (normalized acoustic distance) gibt an wie sicher sich der Erkenner bei einem bestimmten Ergebnis<br />
ist. Ihr zugrunde liegt eine Folge von Merkmalsvektoren für die die NAD berechnet wird. Dazu<br />
werden zunächst zwei zusätzliche Werte ermittelt. Der erste Wert (NLLd) gibt die Wahrscheinlichkeit der<br />
erkannte Vektorfolge an, mit der Beschränkung das nur die im Vokabular angegebenen Befehle möglich<br />
sind. Für den zweiten Wert (NLLr) gibt es keine Einschränkung. Es kann also jede Vektorfolge erkannt<br />
werden. Dadurch das es für NLLr keine Einschränkungen gibt, ist dieser Wert immer kleiner als NLLd.<br />
Umso geringer nun die Differenz von NLLd und NLLr ist, desto sicherer ist es, dass das Ergebnis korrekt<br />
ist. Die NAD wird dabei wie folgt berechnet:<br />
NAD = (NLLd-NLLr)/NLLd<br />
Ein NAD von unter 0.05 steht für einen mit hoher Sicherheit richtig erkannten Befehl.<br />
NED