18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

116 8. Verarbeitung von Sprachsignalen<br />

bestimmte Details so weggelassen werden, daß ein Ausschnitt eines Bildes<br />

nur noch niedrige Frequenzen enthält. Eine völlig weiße Fläche mit gelegentlichen<br />

schwarzen Punkten hat in der entsprechenden zweidimensionalen<br />

Fouriertransformierten viele hohe Frequenzanteile. Ein Tiefpaßfilter und<br />

eine anschließende Rücktransformation in den Bildbereich führt dazu, daß<br />

die schwarzen Punkte ganz verschwinden oder nur noch die Fläche grau<br />

einfärben. Ein ähnliches Vorgehen verfolgen verschiedene Kompressionsalgorithmen<br />

bei der Kompression von Sprachsignalen.<br />

Die Frage, was bei Audiosignalen irrelevante Details sind, wird dabei<br />

etwas anders beantwortet als bei Bildern, aber das Prinzip ist ähnlich.<br />

Leiten wir ein Signal, das eine Grenzfrequenz von 16 kHz hat durch einen 8<br />

kHz Tiefpaßfilter, dann benötigen wir zum Codieren des Resultat auch nur<br />

noch die Hälfte der Datenmenge. Das Signal bleibt dennoch verständlich. Je<br />

stärker wir filtern, umso weniger Daten fallen an und umso unverständlicher<br />

wird das Signal.<br />

Sinnvoller als ein Tiefpaßfilter ist die Zusammenfassung von benachbarten<br />

DFT-Koeffizienten. Dadurch werden die Informationen über die hohen Frequenzen<br />

nicht ignoriert und kleine unwichtige Variationen werden dennoch<br />

” geglättet“. Die einfachste Art wäre die Verwendung mehrerer Bandpaßfilter,<br />

deren Koeffizienten alle zu einem so genannten Filterbankkoeffizienten zusammengefaßt<br />

werden. Bei einer Aufteilung der n DFT-Koeffizienten a1, . . .,an<br />

in m Filterbankkoeffizienten b1, . . .,bm (s. Abb. 8.8) würde sich bi berechnen<br />

als:<br />

bi = n<br />

m ·<br />

(i+1)· m<br />

n −1<br />

<br />

j=i· m<br />

n<br />

aj<br />

ωg/2<br />

ωg/4<br />

ωg/6<br />

0<br />

Abb. 8.8. Filterbänke gleicher Größe<br />

b0 b1 b2<br />

(8.2)<br />

Wollen wir die Funktion des Ohres einigermaßen nachahmen und die<br />

tieferen Frequenzen feiner auflösen, dann sollten wir Filterbänke verwenden,<br />

die mit steigender Frequenz immer breiter werden, wie in Abb. 8.9.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!