18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

19. Parameterraumoptimierung<br />

Bei der Entwicklung eines HMM-basierten Spracherkenners müssen mehrere<br />

Entwurfsvariablen gefunden und optimiert werden. Entwurfsvariablen, die<br />

den Parameterraum der akustischen Modellierung betreffen, sind zum Beispiel<br />

die Anzahl der akustischen Modelle, die Anzahl der Mixturgewichteverteilungen<br />

und der Codebücher, der Kopplungsgrad der Kovarianzmatrizen,<br />

die Breite der modellierten Kontexte, die Anzahl der Zustände eines HMMs<br />

für die verwendeten Spracheinheiten, sowie deren Topologien. Weitere einzustellende<br />

Variablen sind die Größe der Codebücher, das heißt die Anzahl der<br />

Referenzvektoren je Codebuch und die Dimensionalität des Merkmalsraumes.<br />

Auch auf dem Gebiet der temporalen Modellierung der HMMs gilt es,<br />

Entwurfsentscheidungen zu treffen und Variablen einzustellen, wie zum<br />

Beispiel die Feinheit und den Kopplungsgrad der Übergangswahrscheinlichkeiten<br />

und eventuell vorhandene Parameter für explizite Längenmodellierung.<br />

Oft ist es sehr aufwendig und ressourcenintensiv, verschiedene mögliche<br />

sinnvolle Werte für die Entwurfsvariablen durch Experimente auszuwerten<br />

und auf diese Art zu optimieren. Teilweise wird in manchen Bereichen<br />

der Spracherkennungsforschung sogar von einer Art schwarzen Magie<br />

gesprochen, wenn Forscher sogenannte ” educated guesses“ (auf Erfahrung<br />

basierte Schätzungen) vornehmen. Nicht selten kann man beobachten, daß<br />

eine nur sehr wenig vom Optimum abweichende Einstellung bestimmter<br />

Architekturvariablen die Fehlerrate des Erkenners enorm erhöht.<br />

Auf Erfahrung basierende Schätzungen sind auch bei den zahlreichen<br />

sogenannten ” fudge factors“ 1 üblich. Dabei handelt es sich um der Theorie<br />

eigentlich widersprechende Parameter, wie z.B. die Werte z und q in Gleichung<br />

16.25. Solche Parameter werden aus verschiedenen Gründen für eine<br />

zufriedenstellende Funktion der Spracherkenner benötigt. Zum einen ist die<br />

getroffene Modellannahme (HMM erster Ordnung, Gauß-Mischverteilungen)<br />

nicht in völliger Übereinstimmung mit der Natur des Sprachproblems, zum<br />

anderen liegen in der Regel nicht so viele Trainingsdaten vor, daß das in der<br />

Statistik oft zitierte Gesetz der großen Zahl wirkt. Im Gegenteil, meistens<br />

1 engl. fudge: schmierige Schokoladencreme

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!