18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Lasers auswirken.<br />

28.3 Erkennung spontaner Vortragssprache 455<br />

Die meisten heutigen Laser haben ein rotes licht. Einige sind grün.<br />

Für solche Laser ist eine Detektion am einfachsten, indem die Differenz<br />

der Ableitung des Grünanteils und der Ableitung des Rotanteils betrachtet<br />

wird. Wenn ein Bildfolge gegeben ist als folge von RGB Werten<br />

{R1(x, y), G1(x, y), B1(x, y), . . . Rn(x, y), Gn(x, y), Bn(x, y)}, dann kann die<br />

Position eines erscheinenden oder gerade bewegten Lasers zum Zeitpunkt t<br />

bestimmt werden als:<br />

(ˆx, ˆy) = argmax<br />

(x,y)<br />

(Rt(x, y) − Rt−1(x, y))<br />

− (Gt(x, y) − Gt−1(x, y))<br />

− (Bt(x, y) − Bt−1(x, y))<br />

(28.2)<br />

Gl. 28.2 basiert auf der Annahme, daß ein Laserpunkt so hell und so rot<br />

ist, daß die anderen Farben im Verhältnis zum Rot extrem schwach vertreten<br />

sind. Mit den bekanten ” Pixel-Koordinaten“ (ˆx, ˆy) kann dann nach Gl. 28.1<br />

die Position auf der Präsentation berechnet werden.<br />

28.3 Erkennung spontaner Vortragssprache<br />

Vortragssprache ist nicht ganz so spontan wie die Sprache in Besprechungen<br />

oder Telefonaten zwischen einander bekannten Personen. Bei Vorträgen redet<br />

meistens nur eine Person, ein gleichzeitiges Sprechen mehrerer ist kaum zu<br />

erwarten. Der Vortragende hat den Vortrag meistens ein wenig vorbereitet,<br />

oft auch die Präsentationsfolien selbst erstellt, so daß die Vortragssprache<br />

einigermaßen geplant ist. Dennoch ist sie wesentlich spontaner als diktierte<br />

Sprache. Die Verwendung eines völlig unadaptierten Diktiersystems zur<br />

Transkription von Vorträgen führt zu sehr schlechten Erkennungsraten, die<br />

drei bis fünf mal höher liegen als für diktierte Sprache [?]. Und dies gilt<br />

für die Benutzung von Nahbesprechungsmikrophonen. Bei Verwendung von<br />

Kragenmikrophonen steigt die Fehlerrate noch zusätzlich. Bis heute sind<br />

dem Autor keine Studien bekannt, die untersuchen, wie sich die mögliche<br />

Anspannung des Redners vor einem großen Publikum auf die Aussprache<br />

und insbesondere auf die Qualität der Spracherkennung auswirken. Man<br />

kann aber sicherlich davon ausgehen, daß die Situation in der sich ein<br />

Vortragender befindet der Sicherheit und Sauberkeit der Aussprache nicht<br />

gerade dienlich ist.<br />

Ein weiteres Problem von Vorträgen ist, daß sie sich meist auf ein ganz<br />

speziellen Thema beziehen und dieses auch tiefgreifend behandeln. Die

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!