29.01.2014 Aufrufe

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5. FREI VERFÜGBARE SPRACHERKENNER 32<br />

stic Model weiter gegeben. Daraus entstehen die HMM-Graphen der jeweiligen Einheiten. Danach wird<br />

aus diesen HMM-Graph, in Verbindung mit dem Language Model, der Search Graph konstruiert. Der<br />

Sphinx-4 HMM-Graph ist einfach ein gerichteter Objektgraph ohne feste Strukturen. Jeder Knoten korrespondiert<br />

mit einem HMM-Zustand und jede Kante gibt die Übergangswahrscheinlichkeit an. Dadurch<br />

können ganz einfach verschiedenste HMM’s mit unterschiedlichen Topologien geliefert werden. Es gibt<br />

keine Einschränkung bei der Anzahl der Zustände, der Anzahl der Übergänge oder ihrer Richtung. Ein<br />

HMM-Zustand kann die Bewertung für ein beobachtetes Feature erstellen. Was dabei genau berechnet<br />

wird, steht im HMM-Zustand selbst und wird vor dem System versteckt. Wie alles andere, kann auch<br />

das Acoustic Model an die Bedürfnisse des Nutzers angepasst werden. [26]<br />

Search Graph<br />

Der Linguist kann auf viele verschiedene Arten implementiert werden und die Topologien des von ihm<br />

generierten Suchraums variieren sehr. Trotzdem wird der Suchraum immer als Search Graph dargestellt.<br />

Der in Abbildung 5.3 gezeigte Search Graph stellt die primäre Datenstruktur dar, die für den Erkennungsprozess<br />

genutzt wird. In diesem gerichteten Graph steht jeder Knoten für einen festen oder fließenden<br />

Abbildung 5.3: Der Sphinx-4 Search Graph für ’one’ und ’two’ nach [26]<br />

Zustand. Fließende Zustände werden mit eintreffenden Features verglichen. Feste Zustände repräsentieren<br />

sprachliche Konstrukte auf einer höheren Ebene, wie Wörter und Phoneme. Diese werden nicht direkt<br />

mit eintreffenden Features verglichen. Die Kanten repräsentieren die möglichen Zustandsübergänge und<br />

ihre Wahrscheinlichkeit. Der Search Graph kann auf verschiedene Arten implementiert werden. Je nachdem<br />

wie er implementiert wurde, beeinflusst dies die Erkennungsgenauigkeit, die Geschwindigkeit und<br />

den Speicherbedarf. [26]

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!