29.01.2014 Aufrufe

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5. FREI VERFÜGBARE SPRACHERKENNER 29<br />

Abbildung 5.1: Aufbau von Sphinx-4 nach [26]<br />

zeit Kontrollanweisungen an die verschiedenen Module senden und somit auf den Erkennungsprozess<br />

Einfluss nehmen. Sphinx-4 besteht aus vielen einstellbaren Teilen. Um diese Einstellungen vor zu nehmen<br />

wird der Configuration Manager genutzt. Außerdem können mit seiner Hilfe, Module dynamisch<br />

während der Laufzeit geladen oder verändert werden. Zusätzlich werden dem Nutzer viele Werkzeuge<br />

geboten. Mit ihrer Unterstützung können verschiedenste Statistiken, wie zum Beispiel über die Wortfehlerrate<br />

oder die Speichernutzung erstellt werden.<br />

5.1.3 Funktion<br />

Sobald der Erkenner gestartet wird, richtet er das Front End, den Decoder und den Linguist ein. Dabei<br />

werden die Spezifikationen des Nutzers beachtet. Diese Komponenten wiederum legen ihre eigenen<br />

Unterkomponenten an. Der Liguist lädt das Acoustic Model, das Dictionary und das Language Model.<br />

Aus diesen Teilen wird danach ein passender Search Graph konstruiert. Der Decoder erstellt den Search<br />

Manager, der wiederum den Scorer, den Pruner und die Active List anlegt.<br />

Die meisten dieser Komponenten sind Java Interfaces. Für sie existieren verschiedene Implementationen.<br />

Welche Implementation tatsächlich genutzt wird legt der Nutzer in einer Konfigurationsdatei fest. Sie<br />

basiert auf XML und wird vom Configuration Manager geladen. In ihr können auch Eigenschaften wie<br />

zum Beispiel die Sample Rate der eintreffenden Sprachdaten festgelegt werden.<br />

Um ein Eingabesignal richtig zu erkennen wird der Search Graph genutzt. Innerhalb des Graphen gibt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!