18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

240 14. Das akustische Modell<br />

mit Varianten. Die beliebteste Vorgehensweise ist die, daß für jedes Wort, das<br />

mehrere Aussprachen hat, auch mehrere Einträge ins Lexikon eingetragen<br />

werden. Manche Lexika verwenden ganze Phonemgraphen, die als eine Art<br />

regulärer Ausdruck dargestellt werden. Z.B. kann der Eintrag für HABEN<br />

aussehen wie H A {B [E] N | M} und damit die Aussprachen HABEN<br />

HABN und HAM beinhalten. In einem Experiment auf dem Amerikanischen<br />

Wall Street Journal Benchmark konnte die Fehlerrate des Erkenners durch<br />

Verwenden von Aussprachevarianten von 15% auf 12.2% gesenkt werden<br />

Eine in diesem Zusammenhang sehr wichtige Frage ist die nach der<br />

Herkunft und Menge der verwendeten Aussprachevarianten. In einschlägigen<br />

gedruckten Lexika findet man oft nur eine kanonische Aussprache und nur<br />

sehr selten Varianten. Dialekte, regionale Einfärbungen und häufige Abweichungen<br />

findet man sehr selten. Typische Möglichkeiten für die Gewinnung<br />

von Varianten sind:<br />

• Linguisten / Phonetiker<br />

Experten auf diesen Gebieten kennen sich sehr gut aus. Die Praxis zeigt<br />

aber immer wieder, daß die tatsächlichen Laute aus akustischer Sicht oft<br />

nicht den linguistischen Erwartungen entsprechen.<br />

• Akustiker / Spracherkennungsforscher<br />

Diese Experten bringen die besten Aussprachelexika zustande. Oft ist es<br />

erst die Erfahrung mit der Akustik oder mit der Spracherkennung, die zu<br />

solchen Erkenntnissen führt, aufgrund derer eine Aussprachevariante U N<br />

T für das Wort ” und“ eingeführt wird.<br />

• Regelwerk<br />

Ähnlich wie die Beobachtung, daß silbenabschließende G-Laute oft<br />

wie CH-Laute gesprochen werden, kann man auch zahlreiche andere<br />

Regelmäßigkeiten beobachten, die sich in ein Regelwerk zusammenfassen<br />

lassen, mit dessen Hilfe aus einem kanonischen Lexikon eines mit vielen<br />

Varianten vollautomatisch erzeugt werden kann. Typische Regeln für das<br />

Deutsche sind z.B. die so genannte Schwa-Ellision, bei der Schwa-Laute<br />

wie der zweite Vokal im Wort ” haben“ komplett weggelassen werden kann,<br />

oder Änderungen der Vokalqualität wie z.B. beim Wort ” Bäcker“ das eher<br />

wie ” Becker“ ausgesprochen wird.<br />

• Phonemerkenner<br />

Bei diesem Ansatz wird ein Spracherkenner verwendet, der Phoneme statt<br />

Wörter erkennt. Bei ausreichend vielen Beispielen kann selbst auf den<br />

relativ stark fehlerbehafteten Phonemhypothesen eine Statistik erstellt

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!