18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

426 26. Zusätzliche Modalitäten<br />

Kameras, deren Aufnahmen nicht zum Lippenlesen geeignet sind, erkennbar<br />

sein, ob die Lippen sich bewegen. Die Korrelation der Information, wo sich<br />

im Raum bewegende Lippen befinden, mit der Information der akustischen<br />

Schallquellenlokalisierung gibt dann eine Robuste Schätzung der Position<br />

des Sprechers wieder.<br />

26.3 Handschrifterkennung, Gestikerkennung<br />

In der Handschrifterkennung unterscheidet man grundsätzlich zwischen zwei<br />

verschiedenen Ansätzen, der ” Offline“- und der ” Online“-Erkennung. Bei der<br />

Offline-Erkennung liegt dem Erkenner nur das Bild des handgeschriebenen<br />

Textes vor, bei der Online-Erkennung kann der Erkenner zusätzlich die<br />

gemessene Dynamik der Schrift zur Erkennung verwenden. In der Regel<br />

führt diese zusätzliche Information zu besseren Erkennungsraten, so daß<br />

sogar Systeme entwickelt werden, die versuchen, aus dem statischen Bild die<br />

verlorene Dynamikinformation zu rekonstruieren.<br />

Außer zur Erkennung von handgeschriebenen Texten bietet sich die<br />

Modalität der stiftbasierten Eingabe auch für die Erkennung von Formeln,<br />

Skizzen, Bildern und bestimmten Schreibgesten an. Während es einigermaßen<br />

einfach ist, in Skizzen zu erkennen, ob ein Objekt ein Rechteck<br />

oder ein Kreis ist, so gehört zur genauen Interpretation von komplexeren<br />

Objekten und insbesondere von deren Relationen zueinander wesentlich<br />

mehr ” Intelligenz“.<br />

Als zusätzliche Modalität zur Spracherkennung hat sich die Handschrifterkennung<br />

im Zusammenhang mit der Korrektur von Erkennungsfehlern von<br />

Diktiererkennern hilfreich gezeigt (s. folgenden Abschnitt).<br />

26.4 Fehlerbehandlungsmethoden<br />

Die Erfahrung hat gezeigt, daß die allermeisten stochastischen Klassifikatoren,<br />

sei es für die Erkennung von Sprache, Handschrift, Gesten oder<br />

Bilder, Fehler machen. Je nachdem, um was für eine Anwendung es sich<br />

handelt, sind Fehler mehr oder weniger tolerierbar. Bei einem Dialogsystem,<br />

bei dem der Benutzer per Sprache ein Kommando gibt ist es nicht weiter<br />

problematisch, wenn zwar das eine oder andere Wort des Kommandos<br />

mißverstanden wird, aber die gewünschte Aktion dennoch richtig verstanden<br />

und ausgeführt wird. So ist es zum Beispiel egal, ob der Erkenner in einem<br />

Videorecorder beim Kommando ” nimm die Tagesschau auf“ fälschlicherweise<br />

” nimm den Tagesschau auf“ verstanden wird. Hauptsache, das Gerät

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!