18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

330 19. Parameterraumoptimierung<br />

wird der Parameterraum der Spracherkenner so weit aufgeblasen wie nur<br />

irgendwie trainierbar. Man tendiert eher dazu, ein paar schlecht geschätzte<br />

Parameter zuviel zu verwenden, und notfalls Glättungsmethoden einzusetzen,<br />

als zu wenige Parameter zu verwenden, die dann aber gut geschätzt<br />

werden, denn fehlende Information kann nicht ersetzt werden, während<br />

zuviel Information bei geeigneter Handhabung nicht schädlich sein muß.<br />

Schließlich ist ein weiterer Grund für die Verwendung von ” fudge factors“<br />

die oft inkorrekte Implementierung der mathematischen Grundlagen, bei<br />

der, um Rechenzeit zu sparen, Approximationen vorgenommen werden.<br />

Das Ziel der Spracherkennungsforschung ist es, nicht nur fertige, funktionierende<br />

Produkte zu entwickeln, sondern auch Laien zu ermöglichen,<br />

einen für ihre speziellen Zwecke optimierten Spracherkenner selbst zu<br />

bauen, ohne dabei von ihnen zu verlangen, sich mit den verschiedenen<br />

Entwurfsvariablen auszukennen. Solange nicht abzusehen ist, daß fertige<br />

Spracherkennungsprodukte in jeder Umgebung, mit beliebigen Vokabularen,<br />

mit verschiedenen Sprachen und Dialekten sowie für viele verschiedene<br />

Anwendungsszenarien einwandfrei funktionieren, solange wird es interessant<br />

bleiben, daß Entwicklungsumgebungen existieren, mit denen auch Personen,<br />

die nicht auf dem Gebiet der Spracherkennung arbeiten, funktionierende<br />

Spracherkenner bauen können.<br />

Für die Umsetzung eines Forschungsprototypen in ein fertiges Produkt<br />

ist es deshalb sinnvoll, Methoden zu finden, die es ermöglichen, Entwurfsvariablen<br />

automatisch zu optimieren.<br />

19.1 Parameterarten<br />

Im folgenden gehen wir auf die Rolle verschiedener Parameter von typischen<br />

HMM-basierten Spracherkennern ein. Es ist nicht möglich, hier alle denkbaren<br />

Parameter zu behandeln, so daß vor allem die wichtigsten aufführen,<br />

das heißt diejenigen, die für Erkennungsleistung die größte Bedeutung haben.<br />

19.1.1 Mittelwertsvektoren<br />

Die Mittelwertsvektoren sind die wichtigsten Parameter der akustischen<br />

Modellierung mit Normalverteilungen, in dem Sinne, daß die Erkennungsleistung<br />

von einer optimalen Schätzung der Referenzvektoren erfahrungsgemäß<br />

stärker abhängt als von den Kovarianzmatrizen und den Mixturgewichten. Je<br />

größer die Dimensionalität des Merkmalsraumes ist, desto stärker fällt auch

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!