18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

336 19. Parameterraumoptimierung<br />

erhöht, auch die Gesamtwahrscheinlichkeit der Trainingsdaten beliebig weit<br />

erhöhen kann, im Extremfall so weit, daß jedes einzelne Trainingsdatum<br />

seinen eigenen Parameter im Parameterraum hat.<br />

Typische Vorgehensweisen beim Architekturentwurf werden selten<br />

veröffentlicht. Bei den obligatorischen Systembeschreibungen der Spracherkenner,<br />

die an den offiziellen internationalen (D)ARPA Evaluationen<br />

teilnehmen, werden die Parameterräume zwar beschrieben, aber man findet<br />

kaum Informationen darüber, warum diese Architektur ausgewählt wurde.<br />

In der Praxis sieht zum Beispiel die Optimierung der Zahl der akustischen<br />

Modelle so aus, daß für eine Reihe verschiedener Werte ein Erkenner trainiert<br />

und danach evaluiert wird. Der am besten arbeitende Erkenner wird<br />

schließlich zum System der Wahl. Oft läßt sich dieses Vorgehen allerdings<br />

automatisieren, so daß die Hauptlast vor allem durch den Rechenzeitbedarf<br />

bestimmt wird.<br />

19.4 Kompaktifizierung<br />

Ein kompakter Parameter hat mehrere Vorteile. Dazu gehören nicht nur<br />

die leichtere Trainierbarkeit sondern auch Aufwandsaspekte. Weniger<br />

Parameter können sowohl den zeitlichen als auch räumlichen Aufwand von<br />

Spracherkenner deutlich senken. Insbesondere im Hinblick darauf, daß in<br />

naher Zukunft die Spracherkennungstechnologie immer mehr in alltägliche<br />

kleine Geräte Einzug finden wird, ist es wichtig, auch mit kleinen Ressourcen<br />

gute Ergebnisse zu erzielen.<br />

19.4.1 Typen von Kovarianzmatrizen<br />

Es gibt verschiedene Gründe anzunehmen, daß die Verwendung von normalen<br />

Kovarianzmatrizen für die Berechnung der HMM Emissionswahrscheinlichkeiten<br />

mit Mixturen von Normalverteilungen nicht die beste denkbare<br />

Lösung ist. Die Gründe dafür sind zum einen praktischer Natur. Die Anzahl<br />

der Parameter einer vollen Kovarianzmatrix für einen d-dimensionalen<br />

Merkmalsraum beträgt d(d + 1)/2, während die Mittelwertevektoren<br />

lediglich jeweils d Parameter haben. Dadurch ergibt sich nicht nur ein<br />

enormer Speicherbedarf, sondern auch das Problem der Trainierbarkeit.<br />

Viele Parameter benötigen auch viele Trainingsdaten, um ausreichend gut<br />

geschätzt werden zu können.<br />

Ein anderer Nachteil voller Kovarianzmatrizen ist der erhöhte Rechenaufwand.<br />

Die Berechnung einer Normalverteilung mit einer Kovarianzmatrix,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!