18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

18 2. Eigenschaften und Taxonomie von Sprache und Spracherkennern<br />

mit uniformen bzw. wenig variierenden Daten trainiert wurden und auf<br />

passenden Daten eingesetzt werden, besser. Die Parameter der Modelle für<br />

eine sprecherabhängige Datenmenge sind viel ” schärfer“ und leichter von<br />

anderen Modellen zu unterscheiden als bei sprecherunabhängigen Daten.<br />

In einigen Situationen ist es unproblematisch, sprecherabhängige Erkenner<br />

zu verwenden. Bei persönlichen Diktiersystemen zum Beispiel, oder<br />

erst recht bei sicherheitskritischen Anwendungen, die sowieso nur von<br />

einer bestimmten Person verwendet werden dürfen. In solchen Situation<br />

ist man gut beraten, die höhere Leistungsfähigkeit sprecherabhängiger<br />

Systeme auszunutzen. Im allgemeinen jedoch wird man auf Anwendungen<br />

treffen, bei denen der Sprecher keine Zeit hat, erst langwierig seine Stimme<br />

einzutrainieren. Wer will schon erst einen langen Text vorlesen, ehe er<br />

am Fahrkartenautomaten sein Ziel eingeben kann? Daher fokussiert sich<br />

die Spracherkennungsforschung auf die sprecherunabhängige Erkennung,<br />

bestenfalls gesteht man ein, daß wenige Sekunden Sprache verwendet werden,<br />

um die Parameter der Erkenner an den Sprecher zu adaptieren. Ein Teil der<br />

Forschungsanstrengungen versucht das Sprachsignal so zu verarbeiten, daß<br />

die sprecherspezifischen Eigenschaften ausgeblendet werden und möglichst<br />

nur noch sprecherunabhängige übrigbleiben.<br />

2.2 Kontinuierlichkeit<br />

Die Erkennung einzelner Kommandos ist aus verschiedenen Gründen, die<br />

in den folgenden Kapiteln beleuchtet werden, einfacher als die Erkennung<br />

fließender Sprache. Bei gleichen zur Verfügung stehenden Ressourcen<br />

und gleich großem Vokabular funktioniert die Einzelkommandoerkennung<br />

präziser als die Erkennung kompletter beliebig formbarer Sätze. Das heißt,<br />

daß insbesondere bei Anwendungen, die mit wenig Ressourcen auskommen<br />

müssen, wie zum Beispiel Mobiltelefone, und bei Anwendungen, die kein<br />

großes Vokabular benötigen, wie zum Beispiel das Eingeben einer Telefonnummer,<br />

die Wahl eines Einzelkommandoerkenners naheliegt.<br />

In vielen Situationen ist aber ein fließendes Sprechen natürlicher. Eines<br />

der wichtigsten Ziele der automatische Spracherkennung ist es, die <strong>Kommunikation</strong><br />

von <strong>Mensch</strong>en mit <strong>Maschine</strong>n natürlicher zu machen. Daher<br />

beschäftigen sich die meisten Spracherkennungsforscher mit der Problematik<br />

der kontinuierlichen Spracherkennung.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!