18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

21.5 Adaptionsmethoden 367<br />

tion B1(f) zu verwenden, bei der die Frequenz f1 auf B0(f0) abgebildet wird.<br />

Nun lassen sich Filterbankfunktionen prinzipiell beliebig kompliziert<br />

gestaltet. In der Praxis genügt es aber für die VTLN eine einfache Transformation<br />

v zu definieren, die aus zwei linearen Abbildungen zusammengesetzt,<br />

so daß B0(v(f1)) ≈ B0(f0):<br />

<br />

f · a für f ≤ q<br />

v(f) = 1 − p p − q<br />

f ·<br />

1 − q<br />

+<br />

1 − q<br />

für f ≥ q<br />

(21.8)<br />

Abb. 21.6 zeigt, wie die Funktion v(f) und der dazugehörende Effekt<br />

auf die Filterbankberechnung aussieht. Wenn der Vokaltrakt des Sprechers<br />

überdurchschnittlich lang ist (l > 1) dann wird für p ein Wert größer q<br />

gewählt, so daß v lang , die obere der dargestellten Kurven, verwendet wird.<br />

Für die Filterbänke bedeutet das, daß den oberen Frequenzen stärker zusammengestaucht<br />

werden und somit mehr Spektralkoeffizienten auf denselben<br />

Filterbankkoeffizienten abgebildet werden. Und die unteren Frequenzen<br />

werden gedehnt, so daß weniger Information aus diesen Bereichen, in denen<br />

der Sprecher bevorzugt spricht, in den Filterbankkoeffizienten erhalten<br />

bleiben. Für unterdurchschnittlich kurze Vokaltrakte (l < 1) ergibt sich das<br />

entsprechende gegenteilige Bild.<br />

1.0<br />

v(f)<br />

v lang<br />

l > 1<br />

l = 1<br />

vkurz l < 1<br />

q 1.0<br />

Abb. 21.6. Einfache VTLN-Filterbanktransformation<br />

p<br />

f<br />

l > 1 l < 1<br />

p<br />

Filterbänke Filterbänke<br />

für l > 1 für l < 1<br />

Bleibt noch die Frage zu klären, wie geeignete Werte für q und p gefunden<br />

werden. In der Praxis hat sich gezeigt, daß durch einer Verkomplizierung<br />

der Funktion v kaum Gewinne für die Erkennungsgenauigkeit erzielt werden<br />

können. So spielt es auch nur eine kleine Rolle, welcher Wert für q gewählt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!