18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

10. Erkennung statischer Sprachsignale<br />

In diesem Kapitel werden wir einen ersten funktionierenden Spracherkenner<br />

zusammenstellen. Er wird aber nur sehr eingeschränkt einsetzbar sein. Basierend<br />

auf den Erkenntnissen aus den vorausgegangenen Kapiteln werden<br />

wir Sprachsignale verarbeiten und auf die so gefundenen Eigenschaften der<br />

Signale Klassifikationsalgorithmen anwenden.<br />

10.1 Zeitsignalbasierte Erkennung<br />

Versuchen wir zunächst einmal Merkmale des Zeitsignals selbst zu untersuchen.<br />

Betrachten wir die Wellenform einer Sprachaufnahme, so fällt als<br />

erstes auf, daß die auf den Amplituden bestimmte Einhüllende in etwa die<br />

Silbenstruktur der Äußerung widerspiegelt. Zweifellos scheint der Versuch,<br />

größere Vokabulare anhand der Einhüllenden zu erkennen, aussichtslos.<br />

Denkbar wäre höchstens ein Erkenner, der zum Beispiel zwei oder drei<br />

Wörter unterscheiden soll, die alle unterschiedlich viele Silben haben.<br />

Im folgenden werden einige Möglichkeiten der Untersuchung des reinen<br />

Zeitsignals veleuchtet.<br />

10.1.1 Endpunktdetektion<br />

Im Sprachaufnahmeapplet wird der Beginn und das Ende einer Sprachaufnahme<br />

durch Drücken eines Aufnahmeknopfes festgelegt. In vielen Situationen<br />

ist die Verwendung eines solchen Knopfes jedoch nicht wünschenswert. Zum<br />

einen sind das Situationen, in denen man die Hände frei haben möchte, um<br />

mit ihnen andere Aufgaben zu erledigen, und zum anderen solche Fälle, in<br />

denen das Anbringen solcher Knöpfe unpassend ist, wie zum Beispiel bei<br />

einem Münzfernsprecher.<br />

Abgesehen davon, daß die ständige Betätigung eines Knopfes für den<br />

Benutzer lästig ist und dem eigentlichen Ziel der maschinellen Sprachkommunikation,<br />

nämlich der Steigerung der Ergonomie der <strong>Mensch</strong>-<strong>Maschine</strong>-<br />

Schnittstelle, entgegensteht, stellen solche Knöpfe auch Fehlerquellen dar.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!