18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

90 7. Grundlagen der Signalverarbeitung<br />

F wird auch als das Spektrum von f bezeichnet. Die inverse Abbildung<br />

wird inverse Fouriertransformation genannt:<br />

f(t) = 1<br />

2π<br />

+∞<br />

−∞<br />

F(ω) · e iωt dω (7.37)<br />

Der partiellen Summe bei der Fourierreihenentwicklung entspricht bei<br />

der kontinuierlichen Fouriertransformation die Integration über ein endliches<br />

Intervall der Frequenzachse. Wenn eine Funktion f(t) zusammengesetzt ist<br />

aus Schwingungen mit einer maximalen Frequenz die kleiner als ωg ist, dann<br />

heißt f(t) bandbegrenzt und läßt sich schreiben als:<br />

f(t) = 1<br />

+ωg<br />

F(ω) · e<br />

2π −ωg<br />

iωt dω (7.38)<br />

Das heißt insbesondere, daß F(ω) = 0 für |ω| > ωg. In der Praxis können<br />

wir davon ausgehen, daß Sprachsignale immer bandbegrenzt sind. Selbst<br />

wenn sie sehr hohe Frequenzen enthalten sollten, was sehr selten vorkommt,<br />

führt dies durch die in der Regel bei typischen Analog-Digital Wandlern<br />

(bzw. ” Soundkarten“) vorgeschalteten Anti-Aliasing-Filter dazu, daß diese<br />

Frequenzen keinen Effekt auf die Signalverarbeitung haben. Für die Sprache<br />

sind sowieso nur Frequenzen wie in Abb. 5.3 dargestellt von Bedeutung.<br />

Mischt man Schwingungen verschiedener Frequenzen ω1, ω2, . . . zu einem<br />

Signal f(t) = sin(ω1t + φ1) + sin(ω2t + φ2) + . . . zusammen, und kann<br />

man davon ausgehen, daß keine zwei Frequenzen ωi und ωj Vielfache<br />

voneinander sind, so spielt es für den resultierenden Ton keine Rolle, mit<br />

welchen Phasenverschiebungen φ1, φ2, . . . die Mischung durchgeführt wird.<br />

Das Ergebnis hört sich gleich ein. In der Praxis sind Sprachsignale sowieso<br />

nicht nur aus einer Handvoll einzelner Schwingungen zusammengesetzt, so<br />

daß das Problem der Phasenverschiebung komplett vernachlässigt werden<br />

kann. Gehen wir nun davon aus, daß eine Fouriertransformierte F(ω) aus<br />

einem Phasenanteil und einem Amplitudenanteil besteht:<br />

F(ω) = |F(ω)| · e iΦ(ω)<br />

(7.39)<br />

Auch wenn nach der Definition der Begriff Spektrum für die gesamte<br />

Fouriertransformierte steht, so wird er oft auch abkürzend für das Leistungsspektrum<br />

verwendet. Tab. 7.2 faßt verschiedene Bedeutungen des Begriffes<br />

zusammen. Für die Spracherkennung spielt das (komplexe) Spektrum<br />

sowie das Phasenspektrum keine bedeutende Rolle. Am wichtigsten ist das

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!