29.01.2014 Aufrufe

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5. FREI VERFÜGBARE SPRACHERKENNER 34<br />

wertung eines Pfades an einem bestimmten Punkt innerhalb des Search Graph, eine Referenz auf den<br />

aktuellen Zustand, eine Referenz auf das eingegebene Merkmal und andere nützliche Informationen.<br />

Durch den Zustand kann der Search Manager einen Token mit seinem dazugehörigen Zustandsverlauf,<br />

den kontextabhängigen phonetischen Einheiten, Aussprachen, Wörtern und Grammatikzuständen in Verbindung<br />

bringen. Jede Teilannahme endet an einem aktiven Token.<br />

Sphinx-4 bietet ein sub-framework das Search Manager unterstützt die aus Active List, Pruner und Scorer<br />

bestehen. Die Active List wird aus allen, im Moment aktiven Token generiert. Dabei wird die Anzahl<br />

der aktiven Token reduziert, indem der Pruner Token löscht, die sich in einem Endzustand befinden,<br />

obwohl noch weitere Merkmalsvektoren eintreffen. Der Search Manager kommuniziert auch mit dem<br />

Scorer. Wenn eine Bewertung vom Scorer angefordert wird, bekommt dieser Zugriff auf den aktuellen<br />

Merkmalsvektor und führt darauf Berechnungen aus. [26]<br />

5.2 Microsoft Speech API<br />

5.2.1 Allgemeines<br />

Die Speech API wurde von Microsoft entwickelt um Spracherkennung und Sprachsynthese in Windows<br />

Anwendungen nutzbar zu machen. Alle Versionen wurden so entworfen, dass Software Entwickler nach<br />

belieben Anwendungen dafür schreiben können. Dazu wird ein standardisiertes Interfaces genutzt, auf<br />

das mit vielen verschiedenen Programmiersprachen zugegriffen werden kann. Außerdem können Fremdfirmen<br />

ihre eigenen Spracherkenner und TTS Engines erstellen oder existierende anpassen, um mit der<br />

SAPI zu arbeiten. Solange diese Engines konform zu den von Microsoft unterstützten sind, können sie<br />

auch an deren Stelle treten. Die Speech API ist frei weitergebbar und kann mit jeder Windows Anwendung<br />

vergeben werden, die Sprachtechnologien nutzen will. [24]<br />

Hier ein kurzer Überblick über Anwendungen, die die SAPI nutzen:<br />

• Microsoft Narrator in Windows 2000 und höher<br />

• Microsoft Office XP<br />

• Microsoft Windows XP für Tablet PC<br />

• Microsoft Agent<br />

• Microsoft Speech Server<br />

• Microsoft Voice Command<br />

• Microsoft Plus! Voice Command für den Windows Media Player

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!