Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5. FREI VERFÜGBARE SPRACHERKENNER 34<br />
wertung eines Pfades an einem bestimmten Punkt innerhalb des Search Graph, eine Referenz auf den<br />
aktuellen Zustand, eine Referenz auf das eingegebene Merkmal und andere nützliche Informationen.<br />
Durch den Zustand kann der Search Manager einen Token mit seinem dazugehörigen Zustandsverlauf,<br />
den kontextabhängigen phonetischen Einheiten, Aussprachen, Wörtern und Grammatikzuständen in Verbindung<br />
bringen. Jede Teilannahme endet an einem aktiven Token.<br />
Sphinx-4 bietet ein sub-framework das Search Manager unterstützt die aus Active List, Pruner und Scorer<br />
bestehen. Die Active List wird aus allen, im Moment aktiven Token generiert. Dabei wird die Anzahl<br />
der aktiven Token reduziert, indem der Pruner Token löscht, die sich in einem Endzustand befinden,<br />
obwohl noch weitere Merkmalsvektoren eintreffen. Der Search Manager kommuniziert auch mit dem<br />
Scorer. Wenn eine Bewertung vom Scorer angefordert wird, bekommt dieser Zugriff auf den aktuellen<br />
Merkmalsvektor und führt darauf Berechnungen aus. [26]<br />
5.2 Microsoft Speech API<br />
5.2.1 Allgemeines<br />
Die Speech API wurde von Microsoft entwickelt um Spracherkennung und Sprachsynthese in Windows<br />
Anwendungen nutzbar zu machen. Alle Versionen wurden so entworfen, dass Software Entwickler nach<br />
belieben Anwendungen dafür schreiben können. Dazu wird ein standardisiertes Interfaces genutzt, auf<br />
das mit vielen verschiedenen Programmiersprachen zugegriffen werden kann. Außerdem können Fremdfirmen<br />
ihre eigenen Spracherkenner und TTS Engines erstellen oder existierende anpassen, um mit der<br />
SAPI zu arbeiten. Solange diese Engines konform zu den von Microsoft unterstützten sind, können sie<br />
auch an deren Stelle treten. Die Speech API ist frei weitergebbar und kann mit jeder Windows Anwendung<br />
vergeben werden, die Sprachtechnologien nutzen will. [24]<br />
Hier ein kurzer Überblick über Anwendungen, die die SAPI nutzen:<br />
• Microsoft Narrator in Windows 2000 und höher<br />
• Microsoft Office XP<br />
• Microsoft Windows XP für Tablet PC<br />
• Microsoft Agent<br />
• Microsoft Speech Server<br />
• Microsoft Voice Command<br />
• Microsoft Plus! Voice Command für den Windows Media Player