Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
5. FREI VERFÜGBARE SPRACHERKENNER 29<br />
Abbildung 5.1: Aufbau von Sphinx-4 nach [26]<br />
zeit Kontrollanweisungen an die verschiedenen Module senden und somit auf den Erkennungsprozess<br />
Einfluss nehmen. Sphinx-4 besteht aus vielen einstellbaren Teilen. Um diese Einstellungen vor zu nehmen<br />
wird der Configuration Manager genutzt. Außerdem können mit seiner Hilfe, Module dynamisch<br />
während der Laufzeit geladen oder verändert werden. Zusätzlich werden dem Nutzer viele Werkzeuge<br />
geboten. Mit ihrer Unterstützung können verschiedenste Statistiken, wie zum Beispiel über die Wortfehlerrate<br />
oder die Speichernutzung erstellt werden.<br />
5.1.3 Funktion<br />
Sobald der Erkenner gestartet wird, richtet er das Front End, den Decoder und den Linguist ein. Dabei<br />
werden die Spezifikationen des Nutzers beachtet. Diese Komponenten wiederum legen ihre eigenen<br />
Unterkomponenten an. Der Liguist lädt das Acoustic Model, das Dictionary und das Language Model.<br />
Aus diesen Teilen wird danach ein passender Search Graph konstruiert. Der Decoder erstellt den Search<br />
Manager, der wiederum den Scorer, den Pruner und die Active List anlegt.<br />
Die meisten dieser Komponenten sind Java Interfaces. Für sie existieren verschiedene Implementationen.<br />
Welche Implementation tatsächlich genutzt wird legt der Nutzer in einer Konfigurationsdatei fest. Sie<br />
basiert auf XML und wird vom Configuration Manager geladen. In ihr können auch Eigenschaften wie<br />
zum Beispiel die Sample Rate der eintreffenden Sprachdaten festgelegt werden.<br />
Um ein Eingabesignal richtig zu erkennen wird der Search Graph genutzt. Innerhalb des Graphen gibt