18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

26 2. Eigenschaften und Taxonomie von Sprache und Spracherkennern<br />

stärker aufnimmt, als gleichlaute Geräusche in etwa 1 m Entfernung. Der<br />

Autor hat selbst die Erfahrung gemacht, daß bei Verwendung eines billigen<br />

Nahbesprechungsmikrophons die Erkennungsgenauigkeit des auf mehreren<br />

Messen vorgeführten Spracherkenners nicht merklich darunter leidet, wenn<br />

am 10 m entfernten Nachbarstand so laute Musik gespielt wird, daß man sich<br />

dort fast nur schreiend unterhalten kann. Fast die gesamte Forschung auf<br />

dem Gebiet der Spracherkennung bis Mitte der neunziger Jahre wurde im<br />

wesentlichen mit Nahbesprechungsmikrophonen gemacht. Die Signalqualität<br />

von fernbesprechbaren Mikrophonen – oft auch Raummikrophone genannt<br />

– ist selbst bei vorherigem Wissen über den Abstand der Schallquelle zum<br />

Mikrophon deutlich schlechter. Die größten Schwierigkeiten aber kommen<br />

dadurch zum Vorschein, daß Störgeräusche jeglicher Art viel stärker in<br />

die Aufnahmen eingehen, vor allem dadurch, daß die Variationen der<br />

Signale, hervorgerufen durch viel mehr verschiedene mögliche Abstände und<br />

Eigenschaften der Raumakustik, stark zunehmen.<br />

Man kann feststellen, daß selbst bei großem Abstand (von ca. 2 bis 3<br />

Metern) Sprache noch verhältnismäßig gut erkannt werden kann, wenn zuvor<br />

dieser Abstand genau bekannt ist und keine Störgeräusche vorhanden sind.<br />

Das gelingt nur deshalb gut, weil der Spracherkenner auf diese besonderen<br />

Abstands- und Raumakustikverhältnisse spezialisiert wird. Wenn aber keine<br />

idealen Bedingungen vorliegen, und der Abstand nicht bekannt ist, fällt die<br />

Erkennungsgenauigkeit dramatisch ab.<br />

2.6.2 Telefongespräche<br />

Auch wenn in den Zeiten der Breitband-Individualkommunikation es immer<br />

mehr möglich ist, Sprache nahezu unverfälscht zu übertragen, so ist dennoch<br />

damit zu rechnen, daß in vielen Teilen der Welt noch eine Zeit lang Sprachkommunikation<br />

über das Medium Telefon geführt wird, so wie es seit über<br />

hundert Jahren praktiziert wird.<br />

Fast alle Telefonnetze der Welt verwenden einen Bandpaßfilter, der<br />

nur einen Teil des akustischen Spektrums durch die Leitungen überträgt –<br />

typischerweise in etwa zwischen 300 Hz und 3000 Hz. Nicht nur automatische<br />

Spracherkenner, auch <strong>Mensch</strong>en haben größere Probleme, Telefonsprache<br />

zu verstehen, als breitbandige Sprache. Insbesondere diejenigen Laute, die<br />

sich vor allen durch Frequenzanteile jenseits der oberen Grenze von 3000<br />

Hz manifestieren sind schwerer zu unterscheiden. So kann man z.B. am<br />

Telefon ein S von einem F viel schwerer trennen, als wenn man dem Sprecher<br />

gegenüber steht.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!