18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

434 27. Entwicklung von Anwendungen<br />

Wörter oder Wortfragmente) eintippen.<br />

Zu den wichtigsten Daten die vom Erkenner benötigt werden gehört das<br />

Sprachmodell. Diese sollte aus einer sehr großen Menge Text erzeugt werden.<br />

Für Diktiererkenner, die vorgelesene Sprache erkennen sollen, ist dies oft<br />

relativ einfach. Meistens werden Nachrichtentexte verwendet, die es im<br />

Internet oder von Zeitungsverlagen auf CDs gibt. Als erstes müssen solche<br />

Texte ” normalisiert“ werden. Dazu gehört die Entfernung der Interpunktion,<br />

die Verschriftung von Zahlen, die Uniformisierung von Abkürzungen und die<br />

Entfernung von Formatierungsinformationen. Dies ist nötig, damit später<br />

die Berechnung von Sprachmodellen problemlos durchgeführt werden kann.<br />

Für die Erkenner von Spontansprache ist es wesentlich schwieriger, eine<br />

vergleichbar große Menge Textdaten zu sammeln. Die Standard Trainingsdaten<br />

für das Sprachmodell der Wall Street Journal Diktieraufgabe [?]<br />

umfassen über 300 Millionen Wörter. Für die spontanen Verbmobil Dialoge,<br />

mit denen ein großer Teil der Spracherkennungsforschung in deutscher Sprache<br />

durchgeführt wurde, standen hingegen gerade einmal 1/4 Million Wörter<br />

zur Verfügung. Daher empfiehlt es sich beim Erzeugen des Sprachmodells<br />

für spontane Sprache besonders vorsichtig umzugehen, und die wenigen<br />

vorhandenen spontanen Daten gegebenenfalls mit größeren nichtspontanen<br />

Daten zu interpolieren.<br />

Es gibt auch Bestrebungen, spontane Texte künstlich zu erzeugen.<br />

Die Idee hierbei ist es, große Mengen Schriftsprache so zu transformieren,<br />

daß die ähnlich wie spontane Sprache aussieht. Dazu gehören mehrere<br />

Einzeltransformationen wie das Umstellen von Wörtern, das Aufteilen<br />

langer Sätze in kürzere, das Ersetzen typisch schriftsprachiger Wörter durch<br />

umgangssprachliche und so weiter. Solche Verfahren werden Corpus Mapping<br />

genannt. Künstlich erzeugte Textkorpora sind aber erwartungsgemäß<br />

deutlich weniger wertvoll und für die Entwicklung von Spracherkennern<br />

weniger hilfreich als ” echte“.<br />

27.1.4 Erzeugen der Erkennerumgebung<br />

Bevor das Training beginnen kann müssen einige Entwurfskriterien festgelegt<br />

und einige Dateien erzeugt werden. Zu den Entwurfskriterien gehören zum<br />

Beispiel die Art der Berechnung der Emissionswahrscheinlichkeiten, dazu die<br />

Frage nach der Gestaltung des Parameterraums und der Signalverarbeitungsmethoden.<br />

Ohne weiteres Wissen wird man hier die gleichen Entscheidungen<br />

treffen, die bei einen vorhandenen Erkenner bekanntermaßen erfolgreich<br />

funktioniert haben.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!