31.10.2012 Aufrufe

DIPLOMARBEIT

DIPLOMARBEIT

DIPLOMARBEIT

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.2 Vorstellung der Komponenten<br />

Beim Sprachserver wird HBuild nur zur Konvertierung eingesetzt. Die eigentliche Grammatik wird<br />

vom Sprachserver aus den möglichen Optionen selbst erzeugt und dann mit HBuild in ein für den<br />

Spracherkenner brauchbares Format umgewandelt.<br />

3.2.1.4.3 HVite<br />

Für die Spracherkennung ist das Programm „HVite.exe“ zuständig. Es berechnet mit Hilfe der Hidden<br />

Markov Modelle die wahrscheinlichste Modellabfolge und gibt dann ein erkanntes Wort oder er‐<br />

kannten Satz wieder zurück. HVite wird, genauso wie HBuild, extern mit Hilfe der Java‐Anweisung<br />

Runtime.getRuntime().exec() aufgerufen. Neben dem Programmnamen enthält die Be‐<br />

fehlszeile noch eine Reihe weiterer Angaben.<br />

Ein möglicher Aufruf könnte z. B. folgendermaßen aussehen (hier zur Übersicht auf mehrere Zeilen<br />

aufgeteilt, in der Praxis eine Zeile):<br />

Die Bedeutung der einzelnen Parameter wird in Tabelle 10 erläutert:<br />

Parameter Beschreibung<br />

-S tmp.scp Angabe einer Skript‐Datei. Sie enthält in diesem Fall nur den<br />

Dateinamen der Audiodatei.<br />

-w tmp.lat Ein Wortnetzwerk, das für die Erkennung verwendet werden<br />

soll.<br />

-i autosave\unknown\<br />

in#0.mlf<br />

Das Erkennungsergebnis wird in dieser Datei abgespeichert.<br />

-C arbeit\htkfiles\<br />

confs\hvite_audio_8k.cf<br />

Konfigurationsdatei mit Voreinstellungen<br />

-H arbeit\htkfiles\hmms\ Diese Datei enthält die zu verwendenden Hidden Markov<br />

hmm.p\phoneme_3_8k<br />

Modelle (HMMs).<br />

arbeit\htkfiles\dicts\ Das Aussprachelexikon mit allen erkennbaren Worten und<br />

vokabular_info<br />

deren Phonem‐Folgen.<br />

arbeit\htkfiles\dicts\ Eine Datei mit einer Liste aller HMMs. In diesem Fall sind das<br />

phoneme<br />

die Phoneme.<br />

autosave\unknown\in#0.wav Die Eingabedatei mit den zu erkennenden Audio‐Daten.<br />

Tabelle 10: Parameter beim externen Aufruf von HVite.exe<br />

Nach dem Aufruf von HVite liest der Sprachserver die erzeugte MLF‐Datei ein um das Erkennungser‐<br />

gebnis zu erhalten.<br />

40<br />

HVite -S tmp.scp -w tmp.lat<br />

-i autosave\unknown\in#0.mlf<br />

-C arbeit\htkfiles\confs\hvite_audio_8k.cf<br />

-H arbeit\htkfiles\hmms\hmm.p\phoneme_3_8k arbeit\htkfiles<br />

\dicts\vokabular_info<br />

arbeit\htkfiles\dicts\phoneme<br />

autosave\unknown\in#0.wav

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!