18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

432 27. Entwicklung von Anwendungen<br />

• Erzeugen der Erkennerumgebung (Lexikon, Phonemklassen)<br />

• Training und Evaluation<br />

• Einbau in die Anwendung<br />

• Qualitätsanforderungen überprüfen und erfüllen<br />

27.1.1 Vorbereitung<br />

Zur Vorbereitung gehören Aufgaben wie das Sammeln von Informationen<br />

über die neue Sprache. Viele Sprachen haben Eigenheiten, die es im Englischen<br />

und Deutschen nicht in der Art gibt. Einige Sprachen verwenden in<br />

der Schriftform meist keine Vokale (hebräisch, arabisch), andere Sprachen<br />

benötigen die Tonalität zur Bedeutungsunterscheidung (chinesisch), wieder<br />

andere haben eine enorme Flexionsfreiheit (koreanisch), und einige Sprachen<br />

verwenden Laute, die es in kaum einer anderen Sprache gibt. Solche<br />

Eigenheiten müssen im voraus bekannt sein, und es muß eine Lösung der<br />

mit ihnen verbundenen Probleme geplant werden.<br />

Zur Vorbereitung gehört auch die Planung der anstehenden Datensammlung.<br />

Viele Informationen lassen sich aus dem Internet besorgen. Wichtig ist<br />

zu wissen, ob die Sprache eine an die Aussprache angelehnte Orthographie<br />

hat, was in der Sprache ein ” Wort“ ist, welcher anderen Sprache, in der es<br />

bereits Erfahrungen gibt, sie ähnlich ist und so weiter.<br />

27.1.2 Datensammlung<br />

Eine typische Datensammlung beginnt mit der Spezifikation der benötigten<br />

Daten. Für kontinuierliche Erkennung großer Vokabulare sind mindestens<br />

ca. 10 Stunden reiner Sprache nötig. Die Zahl der Sprecher sollte möglichst<br />

groß sein (mehrere Dutzend). Die Verteilung der Geschlechter und der<br />

Altersstufen sollte einigermaßen repräsentativ sein. Der Sprechstil sollte<br />

möglichst dem Stil, für den der Erkenner gebaut wird entsprechen (vorgelesenen<br />

Sprache für Diktiererkenner, spontane Sprache für Dialogerkenner).<br />

Meistens werden Sprachdaten von freiwilligen ” Sprachspendern“ gesammelt.<br />

Wenn es um eine neue Sprache geht, ist es nicht immer leicht, eine<br />

ausreichende Menge Muttersprachler in der Nähe des Forschungslabors zu<br />

finden. Im GlobalPhone Projekt der Universität Karlsruhe [?] reisten daher<br />

Studierende verschiedener Nationalitäten mit Aufnahmegeräten in ihre<br />

Heimatländer und sammelten dort von Muttersprachlern Sprachaufnahmen.<br />

Für spontansprachliche Aufnahmen wird eine Art Beispieldrehbuch<br />

benötigt, in dem festgehalten ist, wie die Aufnahmen grob aussehen sollen,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!