18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

416 25. Erkennung verschiedener Sprachen<br />

Erkenntnisgewinne und Leistungsverbesserungen in einem dieser Gebiete<br />

haben sich oft auch auf die anderen ausgewirkt. Dennoch hat die Identifizierung<br />

von Sprachen einige Eigenheiten: Während bei der Spracherkennung<br />

eine möglichst korrekte Wortfolge gefunden werden muß, ist dies für die<br />

Identifizierung einer Sprache eher weniger wichtig. Im Grunde kann ein<br />

System – ebenso wie <strong>Mensch</strong>en auch – eine Sprache identifizieren, ohne auch<br />

nur ein einziges Wort zu verstehen. Die Schwierigkeiten der LID resultieren<br />

zum einen aus der großen Variationsbreite der Sprechweise verschiedener<br />

Sprecher (Aussprache, Intonation, Sprechgeschwindigkeit, usw.), zum anderen<br />

aus der Veränderlichkeit der Themen und Inhalte des Gesprochenen. Im<br />

übrigen spielen nichtsprachliche Phänomene wie die Kanaleigenschaften, das<br />

Hintergrundrauschen oder Störgeräusche eine besonders schädliche Rolle,<br />

wenn die Klassifikatoren mangels linguistischen Wissens von diesen schlecht<br />

abstrahieren können.<br />

<strong>Mensch</strong>en haben die faszinierende Fähigkeit, innerhalb weniger Sekunden,<br />

teilweise anhand von nur zwei, drei Silben, nicht nur entscheiden zu<br />

können, ob ihnen eine gesprochene Sprache bekannt ist, sondern meist<br />

sogar um welche Sprache es sich handelt. Falls nicht, kann der <strong>Mensch</strong><br />

zumindest typische Charakteristika der Sprache angeben. Bevor wir uns<br />

darum bemühen, <strong>Maschine</strong>n diese Fähigkeit zur Sprachenidentifizierung<br />

beizubringen, sollte untersucht werden, welche Spracheigenschaften beziehungsweise<br />

welche Wissensquellen <strong>Mensch</strong>en zur Identifizierung heranziehen.<br />

Daraus können dann verschiedene Strategien und Informationsquellen, die<br />

für ein automatisches System sinnvoll sein können, abgeleitet werden. In [?]<br />

wird zu diesem Zweck eine Untersuchung an je zwei Personen aus zehn verschiedensprachlichen<br />

Ländern gemacht. Testpersonen wurden Sprachauszüge<br />

von 1, 2, 4 und 6 Sekunden Länge vorgespielt und die Tespersunen wurden<br />

anschließend gefragt, welche der zehn möglichen Sprachen gesprochen wurde.<br />

Danach wurden den Testpersonen mitgeteilt, welche Antwort richtig gewesen<br />

wären so daß sie daraus während der Versuchsreihe lernen konnten. Die<br />

Erkennungsrate lag im Schnitt bei 69,4% (zwischen 39,2% und 100%).<br />

Wichtige Faktoren, die die Erkennungsrate beeinflußten waren die Dauer der<br />

vorgelegten Sprachauszüge, die Vertrautheit der Testperson mit der Sprache<br />

und die Anzahl der Sprachen, die die Testpersonen schon vorher kannten.<br />

Am Ende der menschlichen LID-Experimente wurden die Testpersonen<br />

nach ihren Strategien zur Identifizierung der Sprachen befragt. Demnach<br />

benutzten viele eine Kombination mehrerer Methoden wie dem Heraushören<br />

bestimmter sprachentypischer Phoneme oder Wörter sowie der phonetischen<br />

und prosodischen Merkmale einer Sprache.<br />

Das Verstehen menschlicher Strategien ist ein wichtiges Hilfsmittel zur<br />

Lösung des Problems der automatischen Identifizierung von Sprachen.<br />

Grundsätzlich können sehr viele verschiedene Informationsquellen zur LID

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!