18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

108 8. Verarbeitung von Sprachsignalen<br />

nämlich der direkte Vergleich zweier unmodifizierter Signale. Angesichts der<br />

riesigen Varianz, die der gleiche Laut in seiner Zeitbereichsdarstellung haben<br />

kann, kann ein direkter Vergleich der Abtastwerte, wenn überhaupt, nur in<br />

sehr eingeschränkten Erkennungsaufgaben und nur unter sehr eingeschränkten<br />

Bedingungen zu irgendwelchen nennenswerten Erkennungsraten führen.<br />

Das Identifizieren von einem Vokal aus einer Menge von zwei Vokalen könnte<br />

womöglich so gemacht werden, aber kontinuierliche Sprache bedarf ganz<br />

anderer Vorgehensweisen.<br />

Bei der Frage, welche Information in einem Sprachsignal denn überhaupt<br />

für die Erkennung von Bedeutung ist, orientiert man sich gerne daran,<br />

welche Information das menschliche Ohr dem Gehirn liefert. Dabei kann<br />

man davon ausgehen, daß die wesentliche Information in den Anteilen<br />

einzelner Frequenzen am Gesamtsignal enthalten ist. Zwar können wir<br />

durch die Wahrnehmung von Phasenverschiebungen die Quelle eines Signals<br />

orten, da dessen Schallwellen an dem einen Ohr früher als an dem anderen<br />

ankommen, aber ganz offensichtlich kann man Sprache auch genauso gut<br />

verstehen, wenn sie nur durch ein Ohr gehört wird. Bei der Ortung von<br />

Schallquellen spielt zusätzlich noch die Form und Bewegung des Kopfes eine<br />

Rolle. Aber auch diese tragen bestenfalls zur virtuellen Verbesserung eines<br />

Sprachsignals bei und nicht zum Verstehen selbst. Durch Untersuchungen<br />

am menschlichen Ohr, wie sie im Kapitel 4 beschrieben wurden, wissen wir,<br />

daß einzelne Abschnitte der Gehörschnecke auf bestimmte Frequenzbereiche<br />

im Signal reagieren und so das Ohr eine Art Fourieranalyse durchführt.<br />

Daher arbeiten die allermeisten Spracherkennungssysteme auf irgend einer<br />

Art der Darstellung des Sprachsignals im Frequenzbereich.<br />

Experiment 8.1: Spektralanalyse<br />

Starten Sie das Applet Signal Processing. Auf der Oberfläche sehen Sie ein<br />

Feld, in dem eine Wellenform dargestellt wird, und einige Schaltflächen zum<br />

Aufnehmen, Abspielen und Analysieren eines Teilsignals.<br />

Wenn Sie auf Aufnahme drücken, können Sie in das Mikrophon Ihres<br />

Computers ein paar Sekunden lang sprechen und die Wellenform des Signals<br />

betrachten. Nehmen Sie zunächst einen einfachen Pfeifton auf.<br />

Markieren Sie den Teil der Aufnahme, in dem der Pfeifton zu erkennen ist<br />

und spielen Sie ihn mit Abspielen zur Kontrolle nochmal ab.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!