18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

21.3 Geräuschmodellierung 357<br />

ein Erkenner, der auf Spontaner Telefonsprache trainiert wurde, bessere<br />

Ergebnisse auf spontaner Sprache liefert, die über ein hochqualitatives<br />

Nahbesprechungsmikrophon aufgenommen wurde, als ein sehr guter Diktiererkenner<br />

für Nahbesprechungsmikrophone. Mit anderen Worten, die<br />

Änderung des Übertragungskanals wirkt sich weniger schädlich aus als die<br />

Änderung des Spontaneitätsgrades. Im folgenden werde einige Aspekte der<br />

Handhabung spontaner Sprache erläutert.<br />

Diktierte Sprache zeichnet sich nicht nur dadurch aus, daß die Artikulation<br />

der Worte sauberer ist, sondern auch dadurch, daß die Äußerung<br />

zuvor geplant werden kann. Je nach Anwendung ist es auch möglich, diese<br />

bei Auftreten irgendwelcher Probleme, zu wiederholen, so daß der Erkenner<br />

in der Regel eine saubere, fehlerfreie und Störgeräuschfreie Aufnahme bekommt.<br />

Bei spontaner Sprache entfällt diese Planung. Bei einigen Aufgaben<br />

sind sich die Sprecher nicht einmal bewußt, daß die Sprache aufgezeichnet<br />

wird und für die Erkennung verwendet wird. Solche Sprache enthält sehr oft<br />

Störgeräusche, so daß diese zu den spontanen Effekten zu rechnen sind.<br />

Andere spontane Effekte sind die Varianz der Sprechgeschwindigkeit, das<br />

ungrammatikalische Sprechen und die unsaubere Artikulation, die bis zum<br />

Falschaussprechen und Weglassen ganzer Lautfolgen geht.<br />

21.3 Geräuschmodellierung<br />

Sogar diktierte Sprache, aber vor allem spontane Sprache, insbesondere<br />

Dialoge zwischen <strong>Mensch</strong>en enthalten viele Abschnitte, die in der Regel in<br />

keinem Wörterbuch zu finden sind. Dazu gehören emphatische Pausen wie<br />

” äh“, ” ähm“, hm“ und so weiter, nichtsprachliche Laute wie Husten, La-<br />

”<br />

chen, Räuspern, unbeabsichtigte Geräusche mit der Zunge oder den Lippen,<br />

und vor allem Atemgeräusche. Gerade wenn es sich beim verwendeten Mikrophon<br />

um ein Nahbesprechungsmikrophon handelt, kann es leicht passieren,<br />

daß der Zug der Atemluft deutliche Artefakte ins Sprachsignal einbringt.<br />

Neben diesen durch den Artikulationsapparat erzeugten Geräuschen treten<br />

auch nichtartikulatorische Geräusche auf. Oft wird sogar das eigentliche<br />

Sprachsignal durch solche Geräusche überlagert. Dazu gehören Geräusche,<br />

die durch Bewegungen von Personen oder Gegenständen entstehen, die sich<br />

im Raum, in dem die Sprachaufnahme stattfindet, befinden.<br />

Artikulatorische Geräusche sind meist viel stärker mit der sie umgebenden<br />

Sprache korreliert als nichtartikulatorische. Emphatische Pausen<br />

werden an verschiedenen Stellen mit unterschiedlicher Wahrscheinlichkeit<br />

gemacht. Einige Wortsequenzen werden oft wie ein einzelnes Wort betrach-

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!