DIPLOMARBEIT
DIPLOMARBEIT
DIPLOMARBEIT
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3.2 Vorstellung der Komponenten<br />
Beim Sprachserver wird HBuild nur zur Konvertierung eingesetzt. Die eigentliche Grammatik wird<br />
vom Sprachserver aus den möglichen Optionen selbst erzeugt und dann mit HBuild in ein für den<br />
Spracherkenner brauchbares Format umgewandelt.<br />
3.2.1.4.3 HVite<br />
Für die Spracherkennung ist das Programm „HVite.exe“ zuständig. Es berechnet mit Hilfe der Hidden<br />
Markov Modelle die wahrscheinlichste Modellabfolge und gibt dann ein erkanntes Wort oder er‐<br />
kannten Satz wieder zurück. HVite wird, genauso wie HBuild, extern mit Hilfe der Java‐Anweisung<br />
Runtime.getRuntime().exec() aufgerufen. Neben dem Programmnamen enthält die Be‐<br />
fehlszeile noch eine Reihe weiterer Angaben.<br />
Ein möglicher Aufruf könnte z. B. folgendermaßen aussehen (hier zur Übersicht auf mehrere Zeilen<br />
aufgeteilt, in der Praxis eine Zeile):<br />
Die Bedeutung der einzelnen Parameter wird in Tabelle 10 erläutert:<br />
Parameter Beschreibung<br />
-S tmp.scp Angabe einer Skript‐Datei. Sie enthält in diesem Fall nur den<br />
Dateinamen der Audiodatei.<br />
-w tmp.lat Ein Wortnetzwerk, das für die Erkennung verwendet werden<br />
soll.<br />
-i autosave\unknown\<br />
in#0.mlf<br />
Das Erkennungsergebnis wird in dieser Datei abgespeichert.<br />
-C arbeit\htkfiles\<br />
confs\hvite_audio_8k.cf<br />
Konfigurationsdatei mit Voreinstellungen<br />
-H arbeit\htkfiles\hmms\ Diese Datei enthält die zu verwendenden Hidden Markov<br />
hmm.p\phoneme_3_8k<br />
Modelle (HMMs).<br />
arbeit\htkfiles\dicts\ Das Aussprachelexikon mit allen erkennbaren Worten und<br />
vokabular_info<br />
deren Phonem‐Folgen.<br />
arbeit\htkfiles\dicts\ Eine Datei mit einer Liste aller HMMs. In diesem Fall sind das<br />
phoneme<br />
die Phoneme.<br />
autosave\unknown\in#0.wav Die Eingabedatei mit den zu erkennenden Audio‐Daten.<br />
Tabelle 10: Parameter beim externen Aufruf von HVite.exe<br />
Nach dem Aufruf von HVite liest der Sprachserver die erzeugte MLF‐Datei ein um das Erkennungser‐<br />
gebnis zu erhalten.<br />
40<br />
HVite -S tmp.scp -w tmp.lat<br />
-i autosave\unknown\in#0.mlf<br />
-C arbeit\htkfiles\confs\hvite_audio_8k.cf<br />
-H arbeit\htkfiles\hmms\hmm.p\phoneme_3_8k arbeit\htkfiles<br />
\dicts\vokabular_info<br />
arbeit\htkfiles\dicts\phoneme<br />
autosave\unknown\in#0.wav