18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

102 7. Grundlagen der Signalverarbeitung<br />

Die Berechnung des Signals s[i] aus den Frequenzanteilen c[i] geschieht<br />

entsprechend einfach mit Hilfe der inversen diskreten Fouriertransformation<br />

S = DFT −1<br />

n · C (7.64)<br />

Bei der Berechnung eines diskreten Leistungsspektrums (c[0], c[1], . . .c[n−<br />

1]) eines Signals (s[0], s[1], . . .s[n − 1]), das aus einem durch ω bandbegrenz-<br />

ten f(x) durch Abtasten mit der Abtastrate 2 · ω gewonnen wurde, ist der<br />

am Gesamtsignal.<br />

Wert c[i] der Anteil der Frequenz iω<br />

n<br />

Betrachtet man die Rechenschritte, die nötig sind, um die DFT-<br />

Matrixmultiplikation durchzuführen stellt man fest, daß viele Rechenoperationen<br />

wiederholt werden. Da w eine n-te Einheitswurzel ist, gilt zum<br />

Beispiel (w j ) n = w j oder (w j ) (n/2) = −w j . Unter Vermeidung doppelter<br />

Berechnung derselben Werte wurde in [?] ein Teile-und-herrsche-Algorithmus<br />

vorgestellt, der die obige Matrixmultiplikation statt mit dem üblichen zeitlichen<br />

Aufwand von ca. O(n 3 ) in nur O(n log n) berechnet. Der Algorithmus<br />

ist unter dem Namen schnelle Fouriertransformation (engl. fast Fourier<br />

transform FFT) bekannt. Er funktioniert optimal für Werte von n, die<br />

Zweierpotenzen sind (wegen des Teile-und-herrsche-Prinzips). Er hat in<br />

vielen Bereichen der Signalverarbeitung und Mustererkennung den Aufwand<br />

für Umwandlung eines Signals aus dem Zeitbereich in den Frequenzbereich<br />

so reduziert, daß durch ihn erst sinnvolles Arbeiten möglich wurde. Es existieren<br />

einige Abwandlungen des Algorithmus, die bei Kenntnis der Art des<br />

Signals (zum Beispiel reellwertig) oder bei bestimmten Einschränkungen des<br />

Ergebnisses (zum Beispiel nur Leistungsspektrum ist interessant) besonders<br />

effizient arbeiten.<br />

7.5 Codierung akustischer Signale<br />

Die natürlichste Methode der Codierung von Sprachsignalen ist die so<br />

genannte Pulse Code Modulation (PCM). Auf irgend eine Art sind die<br />

allermeisten gängigen Codes (ob bekannt als .wav oder .au oder .riff etc.)<br />

PCM-Codes. In einer Datei stehen die Meßwerte in ihrer zeitlichen Reihenfolge<br />

hintereinander, wobei n Bits (typischerweise 8 oder 16) als natürliche<br />

Binärzahl oder als ganze Zahl in Zweierkomplementdarstellung den Bereich<br />

f min bis fmax auf die Werte 0 bis 2 n − 1 bzw. −2 n−1 bis 2 n−1 − 1 abbilden.<br />

In der Regel werden die meisten Meßwerte von Sprachsignalen, die der<br />

Analog/Digital-Wandler liefert, eher in der Nähe der 0 (bzw. des Wertes,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!