18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

280 16. Verwendung von Sprachmodellen<br />

außerdem relativ einfach für den Betrachter verständlich. Etwas mächtiger<br />

sind kontextfreie Grammatiken (CFGs). Mit ihnen ließe sich der Automat<br />

aus Abb. 16.4 beschreiben als:<br />

::= | <br />

::= <br />

::= Achtung | ǫ<br />

::= Roboter | ǫ<br />

::= mir <br />

::= hole | bring | besorge<br />

::= Tassen<br />

::= zwei | drei<br />

::= große | kleine<br />

Auch solche kontextfreien Grammatiken (insbesondere in Backus-Naur<br />

Form, BNF) sind für den Spracherkennungslaien gut lesbar. Verwendet<br />

man nur einfache Regeln, so lassen sich derartige Grammatiken automatisch<br />

in HMM-Suchnetzwerke umwandeln. Der große Vorteil gegenüber<br />

der Verwendung von n-Grammen besteht in dem Verzicht auf Trainingsdaten.<br />

Heutige Spracherkenner sind noch weit weg von der Idealvorstellung, auf<br />

jeder Erkennungsaufgabe, unabhängig von der <strong>Kommunikation</strong>sart und den<br />

<strong>Kommunikation</strong>szielen gleich gut zu funktionieren. Die zu verwendenden<br />

Vokabulare und Sprachmodelle sind einfach zu verschieden. Wenn ein<br />

Spracherkennungssystem für eine neue Aufgabe entwickelt werden soll,<br />

z.B. zum Steuern eines Rasenmäherroboters, dann liegen meist keine oder<br />

zumindest keine ausreichenden Textdatenmengen vor, mit denen man für<br />

die Aufgabe spezifische n-Gramme schätzen könnte. Eine Person, die die<br />

<strong>Kommunikation</strong>sschnittstelle zwischen dem <strong>Mensch</strong>en und dem Sprache<br />

erkennenden System beschreiben kann, hat in der Regel keine Probleme,<br />

diese Schnittstelle, das heißt insbesondere die erlaubten beziehungsweise<br />

erwarteten Wortfolgen in Form einer CFG in BNF darzustellen. Mit einem<br />

Text-To-Speech System können dann noch gegebenenfalls zu neuen Wörter<br />

in dieser Darstellung Aussprachen generiert werden, und der Erkenner ist<br />

damit sehr schnell einsatzbereit.<br />

Außer dem ” rapid prototyping“ haben endliche Automaten weitere<br />

Vorteile. Sie sind leicht modularisierbar. Es ist möglich, für Teilaufgaben<br />

Teilgrammatiken zu generieren und das Gesamtsystem aus den Teilen<br />

zusammenzusetzen. Grundsätzlich lassen sich die Regeln einer Grammatik<br />

beziehungsweise die Gewichte der Zustandsübergänge der Automaten auch<br />

mit Wahrscheinlichkeiten versehen und sogar mit denen von allgemeinen<br />

n-Grammen interpolieren. Ein Nachteil von Automaten ist die relativ feste

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!