Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Weitere Magazine

Empfehlungen

Info

7. AUSWAHL EINES SPRACHERKENNERS 48 Ergebnis möglich. Auch der jlab SpeechServer des IAS bietet einen fertigen Spracherkenner. Dieser arbeitet auf Kommandozeilenebene und besitzt schon vordefinierte Schnittstellen. Es gibt eine fertige in JAVA geschriebene Anwendung, bestehend aus einem dem Server und einer Client-Webseite, auf der der Server getestet werden kann. Dort können unter anderem Vokabulare geladen werden, man kann eigene Spracheingaben machen und die eigenen Vokabulare mit Hilfe von Sprachaufnahmen automatisch längeren Tests unterziehen. Der Speech Server ist allerdings nur auf die deutsche Sprache trainiert. Die Antwortzeiten sind zwar recht lang, je nachdem, wie gut man das Vokabular eingestellt hat, liefert der SpeechServer aber gute Erkennungsergebnisse. Darin liegt auch der besondere Vorteil des SpeechServers, da nie eine Trainingsphase nötig ist. Der Server kann auf Kommandozeilenebene initialisiert werden. Dort muss man lediglich einen Pfad für die Konfigurationsdatei und eine Session ID angeben. Optional sind auch noch weitere Einstellungen möglich. Danach kann man mit Hilfe einiger weniger Funktionen neue Vokabulare laden, Sprachdaten an den Server senden und bekommt die entsprechenden Erkennungsergebnisse zurück. Die Ergebnisse werden noch einmal in Tabelle 7.1 dargestellt. Erkenner CMU Sphinx Microsoft Speech API jlab SpeechServer bereit zur Nutzung nein ja ja Sprache englisch versch. Sprachen mögl. deutsch Spracheingabe diskret diskret diskret kontinuierlich Eingangstraining nein ja nein Mehrbenutzerbetrieb ja nein ja Erkennungsergebnis mittelmäßig gut gut (sehr gut mit Training) Tabelle 7.1: Übersicht über die Eigenschaften von CMU Sphinx, MS SAPI und jlab Da für Sphinx der eigentliche Erkenner erst erstellt werden muss und die Erkennungsergebnisse in den Beispielen nicht überragend waren, kommt dieser Erkenner nicht in die engere Wahl für eine Schnittstelle. Die Entscheidung zwischen der SAPI und jlab fällt hingegen schon schwerer. Jlab bietet zwar etwas bessere Erkennungsergebnisse, dafür ist das Erstellen des Vokabulars in Phonemschrift besonders schwierig und die Eingabe auf die deutsch Sprache beschränkt. Durch die höhere Erkennungsgeschwindigkeit und bessere Dokumentation fällt die Wahl am Ende auf die SAPI von Microsoft. Im folgenden Kapitel wird
7. AUSWAHL EINES SPRACHERKENNERS 49 eine vereinfachte Schnittstelle für die SAPI entwickelt, die der Programmsteuerung dienen soll.
Seite 1 und 2: TECHNISCHE UNIVERSITÄT DRESDEN FAK
Seite 3 und 4: 1 Inhaltsverzeichnis 1 Einleitung 6
Seite 5 und 6: 3 5.3.4 Vokabular . . . . . . . . .
Seite 7 und 8: 5 Selbstständigkeitserklärung Hie
Seite 9 und 10: 2. ALLGEMEINE ANGABEN ZU SPRACHEING
Seite 17 und 18: 3. ALLGEMEINER AUFBAU EINES SPRACHE
Seite 25 und 26: 4. ERHÄLTLICHE PROGRAMME 23 4 Erh
Seite 27 und 28: 4. ERHÄLTLICHE PROGRAMME 25 4.1.3
Seite 29 und 30: 4. ERHÄLTLICHE PROGRAMME 27 4.2.4
Seite 31 und 32: 5. FREI VERFÜGBARE SPRACHERKENNER
Seite 43 und 44: 6. TESTS 41 6 Tests Alle drei Syste
Seite 45 und 46: 6. TESTS 43 Menüpunkt Anzahl richt
Seite 47 und 48: 6. TESTS 45 Menüpunkt Sphinx4 JLAB
Seite 49: 7. AUSWAHL EINES SPRACHERKENNERS 47
Seite 53 und 54: 8. ENTWICKLUNG EINER SCHNITTSTELLE
Seite 65 und 66: 9. ABSCHLIESSENDE BETRACHTUNGEN 63
Seite 67 und 68: 9. ABSCHLIESSENDE BETRACHTUNGEN 65
Seite 69 und 70: 10. GLOSSAR 67 10 Glossar Erkennung
Seite 71 und 72: 10. GLOSSAR 69 Sprache zu Sprache u
Seite 73 und 74: 10. GLOSSAR 71 []
Seite 75 und 76: Literaturverzeichnis 73 [13] MICROS
Seite 77 und 78: Abbildungsverzeichnis 75 Abbildungs

Belegarbeit (.pdf - 2.3 MB) - Technische Universität Dresden

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?