18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Spektrum<br />

Cepstrum<br />

Abb. 8.13. Filtern und Liftern eines Signals<br />

einer Flöte macht.<br />

8.4 Codierung durch Lineare Vorhersage 121<br />

Filtern 000 111<br />

000 111<br />

000 111<br />

000 111<br />

Liftern 000 111<br />

000 111<br />

000 111<br />

000 111<br />

8.4 Codierung durch Lineare Vorhersage<br />

In den Sechzigern wurde zunächst ohne die Motivation, dadurch eine<br />

Vorverarbeitung für die Spracherkennung zu entwickeln, an Codierverfahren<br />

gearbeitet, die eine kompaktere Darstellung des Sprachsignals ermöglichen,<br />

insbesondere für die digitale Speicherung und Übertragung [?]. Als besonders<br />

sinnvoll erwies sich das Verfahren der linearen Vorhersage. Wir werden<br />

im folgenden zeigen, wieso es sich dabei um eine Art Spektralanalyse handelt.<br />

Ziel der Linearen Vorhersage ist es, eine möglichst gute Schätzung des<br />

Abtastwertes s(n) als Linearkombination der p vorausgegangenen Abtastwerte<br />

s(n − 1)...s(n − p) abzugeben, also:<br />

s(n) = e(n) +<br />

p<br />

ais(n − i) (8.4)<br />

i=1<br />

Da meist s(n) nicht exakt als Linearkombination der vorherigen p Werte<br />

dargestellt werden kann, liegt die Vorhersage um einen Fehler e(n) daneben.<br />

Man wird sagen, daß eine Wahl der Vorhersagekoeffizienten ai umso besser<br />

ist, je kleiner der Fehler im Schnitt ist. Die Vorhersagekoeffizienten ai werden<br />

auch LPC-Koeffizienten (Linear Predictive Coding [?]) genannt.<br />

Abb. 8.15 zeigt, wie die Funktion aus Abb. 8.14 auf dem Einheitskreis<br />

aussieht. Da Sprachsignale reellwertig sind, ist die hier dargestellte<br />

z-Transformierte symmetrisch. Die Funktionswerte auf dem Einheitskreis<br />

zwischen 0 ◦ und 180 ◦ wiederholen sich spiegelbildlich zwischen 180 ◦ und 360 ◦ .<br />

Später wurde dann die LPC-Darstellung als sinnvoller Merkmalsraum für<br />

Spracherkennungssysteme erkannt [?]. Mit der Zeit ging ihre Bedeutung aber

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!