18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

404 24. Dialogsteuerung<br />

noch Prädikat, und dennoch gehört es zu dem am häufigsten gehörten<br />

Äußerungen in den meisten Dialogen. Daher genügt der linguistische Begriff<br />

eines Satzes nicht, um alle Phänomene zu beschreiben, mit denen wir uns<br />

hier als Verarbeitungseinheiten in einem Dialogsystem beschäftigen.<br />

Eine aus Sicht der Spracherkennung geeignetere Einheit ist die Äußerung<br />

(utterance). Sie beinhaltet alles, was ein Sprecher zwischen zwei<br />

(nicht all zu kurzen) Pausen sagt. Dies kann ein vollständiger Satz sein,<br />

kann aber genauso auch nur ein Satzfragment, eine Phrase, ein einzelnes<br />

Wort oder gar nur ein Laut sein, andererseits aber auch aus mehreren<br />

aufeinanderfolgenden Sätzen bestehen. Viele Dialogsysteme, die von ihrem<br />

Benutzer nicht verlangen, den Beginn und das Ende einer Aufnahme durch<br />

Betätigen einer Taste zu markieren, verwenden Sprachdetektoren, die den an<br />

sich unbegrenzten Audiostrom segmentieren. Ein Segment ist üblicherweise<br />

von zwei Stillephase umgeben und entspricht einer Äußerung.<br />

In Dialogen (oder – wenn es den Begriff gäbe – in Polylogen) kann ein<br />

Sprecher mehrere Äußerungen tätigen, bevor ein anderer einen Dialogbeitrag<br />

leistet. Im Englischen wird die Menge der Äußerungen eines Sprechers, die<br />

er ununterbrochen macht, als Turn bezeichnet. Im Deutschen wurde diesem<br />

Begriff bisher kein anderes Wort als Übersetzung gegeben, so daß auch im<br />

Deutschen das Wort Turn verwendet wird. In vielen Sprachdatenbanken, die<br />

auch heute noch sehr oft mit expliziter Markierung von Aufnahmeanfängen<br />

und -enden gemacht werden, fällt der Begriff Turn meist mit dem Begriff<br />

Äußerung zusammen.<br />

Ein Dialog ist demnach eine folge von Turns, die abwechselnd von<br />

dem einen und dem anderen Dialogpartner kommen. Die Problematik des<br />

Gleichzeitigsprechens mehrerer Sprecher ist in der Spracherkennung noch<br />

nicht ausreichend behandelt. Vor allem bei <strong>Mensch</strong>-<strong>Mensch</strong>-Dialogen ist<br />

sogenannter crosstalk zu beobachtet. Bei <strong>Mensch</strong>-<strong>Maschine</strong>-Dialogen ist<br />

es unproblematisch, die Sprachsynthese abzubrechen, wenn die <strong>Maschine</strong><br />

feststellt, daß der menschliche Dialogpartner spricht. Aus diesen Gründen ist<br />

eine gesonderte Untersuchung des Gleichzeitigsprechens bei der Entwicklung<br />

von automatischen Dialogsystemen eher uninteressant, und wir gehen davon<br />

aus, daß die Sprecher bzw. der Sprecher und die <strong>Maschine</strong> sich abwechseln.<br />

Eine bestimmte Art des Gleichzeitigsprechens tritt jedoch so häufig auf,<br />

daß sie an dieser Stelle erwähnt werden muß. Dabei handelt es sich um die<br />

sogenannten Back-Channels. Sie sind keine Turns im eigentlichen Sinne. Es<br />

handelt sich vielmehr um sehr kurze Äußerungen, die man macht, während<br />

der Dialogpartner spricht, ohne diesen dabei zu unterbrechen. Das sind meist<br />

Äußerungen der Art ” hm“, ” ja“, ” aha“, ” oh“, ” okay“, die im wesentlichen<br />

nur das Vorhandensein der Aufmerksamkeit vermitteln sollen, bestenfalls

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!