Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5. FREI VERFÜGBARE SPRACHERKENNER 32<br />
stic Model weiter gegeben. Daraus entstehen die HMM-Graphen der jeweiligen Einheiten. Danach wird<br />
aus diesen HMM-Graph, in Verbindung mit dem Language Model, der Search Graph konstruiert. Der<br />
Sphinx-4 HMM-Graph ist einfach ein gerichteter Objektgraph ohne feste Strukturen. Jeder Knoten korrespondiert<br />
mit einem HMM-Zustand und jede Kante gibt die Übergangswahrscheinlichkeit an. Dadurch<br />
können ganz einfach verschiedenste HMM’s mit unterschiedlichen Topologien geliefert werden. Es gibt<br />
keine Einschränkung bei der Anzahl der Zustände, der Anzahl der Übergänge oder ihrer Richtung. Ein<br />
HMM-Zustand kann die Bewertung für ein beobachtetes Feature erstellen. Was dabei genau berechnet<br />
wird, steht im HMM-Zustand selbst und wird vor dem System versteckt. Wie alles andere, kann auch<br />
das Acoustic Model an die Bedürfnisse des Nutzers angepasst werden. [26]<br />
Search Graph<br />
Der Linguist kann auf viele verschiedene Arten implementiert werden und die Topologien des von ihm<br />
generierten Suchraums variieren sehr. Trotzdem wird der Suchraum immer als Search Graph dargestellt.<br />
Der in Abbildung 5.3 gezeigte Search Graph stellt die primäre Datenstruktur dar, die für den Erkennungsprozess<br />
genutzt wird. In diesem gerichteten Graph steht jeder Knoten für einen festen oder fließenden<br />
Abbildung 5.3: Der Sphinx-4 Search Graph für ’one’ und ’two’ nach [26]<br />
Zustand. Fließende Zustände werden mit eintreffenden Features verglichen. Feste Zustände repräsentieren<br />
sprachliche Konstrukte auf einer höheren Ebene, wie Wörter und Phoneme. Diese werden nicht direkt<br />
mit eintreffenden Features verglichen. Die Kanten repräsentieren die möglichen Zustandsübergänge und<br />
ihre Wahrscheinlichkeit. Der Search Graph kann auf verschiedene Arten implementiert werden. Je nachdem<br />
wie er implementiert wurde, beeinflusst dies die Erkennungsgenauigkeit, die Geschwindigkeit und<br />
den Speicherbedarf. [26]