18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

9.1 Klassifikatoren 137<br />

Eine weitere Möglichkeit ist das Erzeugen von Codebüchern durch<br />

” Wachsenlassen“. Dabei besteht das initiale Codebuch aus nur einem Refe-<br />

renzvektor. In Abb. 9.7 ist das einelementige Codebuch links als Gausglocke<br />

(s.u.) über allen Trainingsmustern dargestellt. Der Algorithmus zum Wachsenlassen<br />

der Codebücher [?] prüft nun iterativ welche Referenzvektoren<br />

aus so vielen Daten gemittelt werden, daß diese Daten womöglich bimodal<br />

verteilt sind und es sinnvoller wäre, sie mit zwei Referenzvektoren N1 und<br />

N2 zu modellieren, die jeweils auf den Daten X1 und X2 geschätzt werden.<br />

Das Wachstum der Codebücher kann abgebrochen werden, wenn sonst nicht<br />

mehr ausreichend Trainingsdaten zum schätzen der einzelnen Mittelwerte<br />

vorhanden wären.<br />

N1<br />

Abb. 9.7. Auftrennen einer Gauß-Verteilung in zwei<br />

Das Bucket Voronoi Intersection Verfahren<br />

Bei sehr großen Codebüchern (manche Spracherkenner haben mehrere Millionen<br />

Referenzvektoren) muß natürlich die ständig vorkommende Berechnung<br />

der Distanzen möglichst zeitsparend durchgeführt werden. Dazu bieten<br />

sich zwei Strategien an: einmal eine effiziente Berechnung der Distanzen<br />

selbst, und zum anderen die Einsparung von unnötigen Distanzberechnungen.<br />

Wenn es darum geht, nur den nächsten Referenzvektor zu finden, dann<br />

ist es möglich, die euklidische Distanzberechnung abzubrechen, wenn die<br />

nach j Dimensionen akkumulierte Teildistanz größer ist, als die bis dahin gefundenen<br />

kleinste Gesamtdistanz. Sortiert man die Dimensionen absteigend<br />

nach ihrer Varianz, dann kann man so zusätzlich die Wahrscheinlichkeit<br />

dafür maximieren, daß ein Abbruch der Distanzberechung vorgenommen<br />

werden kann. Die Praxis hat gezeigt, daß man für Sprachdaten, und da<br />

insbesondere für ca. 16-dimensionale Spektral- oder Cepstral-Vektoren,<br />

durch den Abbruch der Distanzberechnungen nur wenig Zeit einsparen kann.<br />

Immerhin führt man durch die jetzt benötigten Vergleiche der Teildistanzen<br />

mit der minimalen Gesamtdistanz einen zusätzlichen Aufwand ein. Diesen<br />

kann man zwar wiederum reduzieren, indem man den Vergleich nicht nach<br />

X1<br />

N2<br />

X2

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!