18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

17.2.6 Einbindung von Modalitätenfragen<br />

17.2 Ballung von Kontexten 311<br />

Die Ausprägung eines Lauts hängt natürlich nicht nur vom phonetischen<br />

Kontext ab, sondern auch von zahlreichen anderen Umständen. Am offensichtlichsten<br />

wird dies, wenn wir dasselbe Wort von Personen sprechen<br />

lassen, deren Aussprache von unterschiedlichen Dialekten oder zumindest<br />

Akzenten geprägt wird. Damit ist jetzt nicht eine komplett andere Aussprachevariante<br />

gemeint, die einen eigenen Eintrag im Aussprachelexikon<br />

verdient hätte, sondern die ” gleiche“ Phonemfolge, die sich jedoch anders<br />

anhört, je nachdem aus welcher Gegend der Sprecher kommt. Außer dem<br />

phonetischen Kontext und dem aktuellen Dialekt bzw. Akzent gibt es weitere<br />

so genannte Modalitäten, die die Aussprache beeinflussen. Das Geschlecht<br />

der Sprecherin oder des Sprechers hat erheblichen Einfluß vor allem auf<br />

die Tonlage. Bestimmte Laute verändern sich, wenn besonders schnell oder<br />

besonders langsam gesprochen wird. Selbst Hintergrundrauschen kann sich<br />

auf verschiedene Laute unterschiedlich auswirken, hochenergetische Laute<br />

wie Vokale werden durch Rauschen weniger gestört als niedrigenergetische<br />

wie Konsonanten. Ähnliches kann man auch bei Telefonsprache beobachten.<br />

Der typische Bandpaß eines Telefonkanals stört Laute, die große Anteile an<br />

hohen Frequenzen haben wie Frikative mehr, was man auch daran erkennt,<br />

daß die Laute F und S am Telefon schwer zu unterscheiden sind.<br />

0=stimmlos<br />

K1 K2<br />

+1=Stop<br />

0=Wortende<br />

K3 K4<br />

K5 K6<br />

-1=Vokal<br />

Geschwindigkeit = hoch<br />

+1=B<br />

-1=Frikativ<br />

K9 K10<br />

SNR < 30dB Geschlecht = F<br />

Abb. 17.13. Ballungsbaum mit Modalitätenfragen<br />

K7 K8<br />

Manche dieser Modalitäten sind vollkommen statisch wie zum Beispiel<br />

das Geschlecht oder der Dialekt und lassen sich womöglich vor dem eigentlichen<br />

Erkennungslauf bestimmen. Danach kann das passende akustische<br />

Modell ausgewählt und beibehalten werden. Andere Modalitäten wie Hintergrundrauschen<br />

oder auch die Sprechgeschwindigkeit können wesentlich<br />

dynamischer sein, und sich sogar innerhalb eines Satzes verändern.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!