29.01.2014 Aufrufe

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2. ALLGEMEINE ANGABEN ZU SPRACHEINGABESYSTEMEN 9<br />

2.1.3 Sprechererkenner<br />

Sprechererkennung soll in verschiedensten Anwendungen die Sicherheit erhöhen indem sie normale<br />

Logins und Passwörter erweitern oder ersetzen. Die Stimme dient dabei als ein einzigartiges Erkennungsmerkmal.<br />

Bei der Sprecherverifikation muss der Nutzer einen Login verwenden und das System<br />

überprüft nur ob die Spracheingabe zum Login passt. Bei der Sprecheridentifikation weiß das System<br />

nicht, wer sich gerade anmelden will und muss aus einer großen Menge von möglichen Nutzern den<br />

richtigen herausfinden. In beiden Fällen muss dem System vorher jedoch eine Sprachprobe des Nutzers<br />

nehmen. Für Sprechererkennung reicht diskrete Spracheingabe aus. Der Wortschatz sollte in diesem Fall<br />

recht groß gewählt werden 2 .<br />

2.2 Anforderungen<br />

2.2.1 Wortschatz<br />

Der Wortschatz spiegelt die Gesamtmenge aller Wörterbucheinträge wieder und verdeutlicht damit, wie<br />

viele Wörter das Programm versteht. In Tabelle 2.1 wird, mittels einer kleinen Beispielrechnung verdeutlicht,<br />

wie viele Einträge für einen halbwegs ausreichenden Wortschatz in deutsch und englisch mindestens<br />

nötig sind. In Tabelle 2.2 werden die benötigten Wortschätze für verschiedene Anwendungen<br />

gegenüber gestellt. 3 Sprache Basiswortschatz Wortformen Gesamtwortschatz<br />

deutsch 4.000 10 40.000<br />

englisch 800 4 3.200<br />

Tabelle 2.1: Mindestwortschatz einer Diktieranwendung in deutsch und englisch nach [1]<br />

Große Wortschätze sind sehr gut geeignet um beinahe jede Art von Spracheingabe zu realisieren. Umso<br />

größer der Wortschatz jedoch wird, desto schwerer wird es für den Erkenner die Eingabe zu analysieren.<br />

2 Ein besonders ausgereiftes System könnte sicher aus einem einzigen Wort, das jeder Nutzer aussprechen muss, genau bestimmen<br />

um welchen Nutzer es sich handelt. Aus Sicherheitsgründen ist dies jedoch nicht sehr ratsam. Eine böswillige<br />

Person könnte sich sonst mit Hilfe einer Sprachaufzeichnung als jemand anderes ausgeben. Daher ist es besser einen sehr<br />

großen Wortschatz zu verwenden und den Nutzer dazu auffordern ein zufällig gewähltes Wort auszusprechen.<br />

3 Diese Angaben erscheinen sehr gering, wenn man bedenkt, dass der vollständige Wortschatz im Deutschen, je nach Quelle,<br />

300.000-500.000 und im Englischen reichlich 300.000 Wörter enthält. Diese Wortfülle wird jedoch meist nicht einmal<br />

annähernd ausgeschöpft. So beinhaltet der deutsche Basiswortschatz im alltäglichen Gebrauch nur etwa 400-800 Wörter<br />

und erst versierte Redner nutzen einen Basiswortschatz von 4.000 bis 10.000 Wörtern. Weiter Informationen dazu finden<br />

sich auch unter http://de.wikipedia.org/wiki/Wortschatz

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!