18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

80 7. Grundlagen der Signalverarbeitung<br />

wird quasi automatisch aufgrund des hierarchischen internen Aufbaus vieler<br />

A/D Wandler postuliert. Der Zweierlogarithmus dieser Intervallzahl wird<br />

als ” Auflösung“ des Wandlers mit der Einheit ” bit“ angegeben. Übliche<br />

Werte sind 8 bit oder 16 bit. Je nach Aufgabe gibt es in einigen Fällen auch<br />

Wandler mit anderen Auflösungen. Wie wir aus Abs. 5.2 wissen, schwankt<br />

der Schalldruckpegel von Sprache um ca. 60 dB zwischen leisem Flüstern<br />

und lautem Schreien. Wenn wir wollen, daß der Signal-zu-Rausch-Abstand<br />

in der gleichen Größenordnung ist, dann stellen wir fest, daß eine Auflösung<br />

von ca. 12 bit in der Regel ausreichend ist. Eine höhere Auflösung würde<br />

nur mehr wertlose Information in die Aufnahme bringen.<br />

Die Abtastfunktion des A/D Wandlers wird im wesentlichen durch die Abtastfrequenz<br />

beschrieben. Sie gibt die Rate an, mit welcher die quantisierten<br />

Signale in eine diskrete Folge von Abtastwerten gewandelt werden. Aufnahmen<br />

in CD-Qualität verwenden eine Abtastrate von 44.1 kHz, DAT (Digital<br />

Audio Tape) Recorder tasten mit 48 kHz ab, die meisten Sound-Karten bieten<br />

standardmäßig 16 kHz und 8 kHz an. Im weiteren Verlauf dieses Kapitels<br />

wird auf das Abtasttheorem eingegangen, welches besagt, daß man, um keine<br />

Information zu verlieren, ein Signal mit der maximalen Frequenz ω mit einer<br />

Abtastfrequenz von mindestens 2ω abtasten muß. Die in diesem Zusammenhang<br />

relevante Maximalfrequenz wird normalerweise durch den Anti-Aliasing<br />

Filter festgelegt, aber auch durch den Gesamtaufbau der Aufzeichnungseinrichtung<br />

(z.B. der Mikrophoneigenschaften) beeinflußt. Meistens paßt die digitalisierte<br />

Version des Signals nicht optimal auf die analoge Version, selbst<br />

wenn die Abtastrate ausreichend hoch ist, weil die meisten A/D Wandler verschiedene<br />

Frequenzen unterschiedlich gut quantisieren. Wir wollen uns aber<br />

mit dieser Problematik nicht weiter befassen und gehen davon aus, daß die<br />

Qualität der verwendeten A/D Wandler ausreichend hoch ist. Halten wir also<br />

fest: Die Funktion eines A/D Wandlers wird im wesentlichen durch drei<br />

Variablen beschrieben: ωg, die Grenzfrequenz des Anti-Aliasing Filters; b, die<br />

Auflösung in bits; und r die Abtastrate.<br />

7.2 Systeme<br />

Im Zusammenhang mit der Signalverarbeitung wird oft von Systemen<br />

gesprochen. Im allgemeinen ist damit ein Algorithmus gemeint, der aus<br />

einem Eingabesignal ein Ausgabesignal erzeugt: f in → System → f out .<br />

Wenn es aber um die digitale Verarbeitung von Sprachsignalen geht, interessiert<br />

eigentlich nur eine bestimmte Klasse von Systemen, die sogenannten<br />

kausalen linearen zeitinvarianten Systeme. Kausal bedeutet, daß f out (x)<br />

nur von f in (−∞ . . . x) abhängt, d.h. die Ausgabe eines Systems hängt zu<br />

einem Zeitpunkt nur von den bis dahin gelesenen Eingaben ab und nicht<br />

von den in der ” Zukunft“ noch ankommenden ab. Ein System wird dann

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!