DIPLOMARBEIT

Weitere Magazine

Empfehlungen

Info

3.1 Rahmenbedingungen Die Vorteile von Eclipse sind: 36 • kostenlos • ständige Verbesserungen dank Open‐Source • Unterstützung einer Vielzahl von Programmiersprachen • Echtzeit‐Syntax‐Überprüfung • Anpassung der dargestellten Informationen durch sog. Views und Perspektiven • Erweiterbarkeit durch Plug‐Ins • Für viele Plattformen verfügbar, da auf JAVA basierend 3.1.4 Betriebssystem Als Betriebssystem wird, sowohl für die Entwicklung als auch für die Anwendung selbst, Microsoft Windows XP verwendet. Der Grund dafür ist, dass auf den Rechnern, die für die Entwicklung zur Ver‐ fügung stehen, Windows XP bereits installiert ist. Auch im späteren Gebrauchsumfeld stehen Rech‐ ner mit Windows XP zur Verfügung. Dank der Portierbarkeit, die JAVA mit sich bringt, ist es auch denkbar, dass die Anwendung später auf Linux‐Rechnern eingesetzt wird. Dazu wären voraussichtlich nur minimale Änderungen nötig. 3.1.5 Grundkonzept Das Grundkonzept ist recht einfach: Der VoIP‐Client wird beim Start des Sprachservers geladen. Wenn eine VoIP‐Verbindung besteht, dann werden die ankommenden Audiodaten zum Sprachserver umgeleitet. Der Sprachserver verwendet für die Erkennung nun diese umgeleiteten Daten, anstatt derjenigen, die vom Audioeingang der Soundkarte kommen. Genauso sendet der VoIP‐Client nun nicht mehr die Daten, die vom Audioeingang kommen, sondern die Daten, die von der Sprachsynthese ausgegeben werden. 3.2 Vorstellung der Komponenten 3.2.1 Der Sprachserver 3.2.1.1 Einleitung Der Sprachserver, auch als Friedberger Sprachserver (FBSV) bezeichnet, ist eine JAVA‐Anwendung, die von Prof. Dr. Stephan Euler entwickelt wurde. Der Zweck des Sprachservers ist es, Sprachdialoge mittels Spracherkennung und Sprachsynthese zu ermöglichen. Die Funktion des Sprachservers kann grob in vier Komponenten unterteilt werden: 1. Der VoiceXML‐Parser, der Dialoge in Form von VoiceXML‐Dateien abarbeitet 2. Der Wortgrenzendetektor, der eine Äußerung des Benutzers aufzeichnet und dabei Anfang und Ende erkennt 3. Der Spracherkenner, der die Äußerung analysiert und die wahrscheinlichste Antwort zurück‐ liefert 4. Die Sprachsynthese, die Textausgaben in Audiosignale umwandelt und ausgibt
3.2 Vorstellung der Komponenten Das folgende Diagramm erklärt das Zusammenspiel der verschiedenen Komponenten an einem klei‐ nen Beispiel: Abbildung 15: Funktionsweise des Sprachservers Im Folgenden werden nun die einzelnen Komponenten etwas näher beschrieben. 3.2.1.2 VoiceXMLParser Der VoiceXML‐Parser ist das Grundgerüst des Sprachservers. Er öffnet und verarbeitet die .vxml‐ Dateien, in denen festgelegt ist, welche Aktionen der Server ausführen soll. Sie enthalten die Vorlage für den Ablauf des gesamten Dialogs. Die Bestandteile einer .vxml‐Datei werden als Items bezeichnet. Das Extrahieren der einzelnen Items aus der Datei geschieht mit Hilfe von SAX (Simple API for XML). SAX ist ein Standard, der eine Prog‐ rammierschnittstelle zum Zugriff auf Daten im XML‐Format beschreibt. Die nötigen Funktionen dazu sind bereits in der JAVA Laufzeitumgebung im Paket javax.xml enthalten. Nutzt eine Anwendung den SAX‐Standard, so können bestimmten Ereignissen spezielle Funktionen zugewiesen werden. Man spricht dabei von sogenannten callback‐Funktionen. Ein Ereignis wäre z.B. das Erreichen eines Items für die Audioausgabe. Hier würde eine Funktion aufgerufen werden, die dafür sorgt, dass auch tatsächlich eine angegebene Audiodatei abgespielt wird. Beim FBSV sind die einzelnen Funktionen jeweils in einer eigenen Klasse untergebracht. VxItem ist die Oberklasse mit Eigenschaften und Funktionen, die von unterschiedlichen Items genutzt werden. Die anderen Klassen sind jeweils Ableitungen dieser Klasse, die für das Item spezifische Funktionen enthalten. 37
Seite 1 und 2: DIPLOMARBEIT Fachgebiet der Diploma
Seite 3 und 4: Inhaltsverzeichnis Inhaltsverzeichn
Seite 5 und 6: Inhaltsverzeichnis 3.2.2.2 Die wich
Seite 7 und 8: 1 Aufgabenstellung 1 Aufgabenstellu
Seite 9 und 10: 2.1 Voice‐over‐IP 2 Grundlagen
Seite 11 und 12: 2.1 Voice‐over‐IP Adresse in de
Seite 13 und 14: 2.1 Voice‐over‐IP 2.1.5 Problem
Seite 15 und 16: 2.1 Voice‐over‐IP Nachteile Tei
Seite 17 und 18: 2.2 Session Initiation Protocol (SI
Seite 19 und 20: 2.2 Session Initiation Protocol (SI
Seite 21 und 22: 2.3 Spracherkennung 2.3.3 Anwendung
Seite 23 und 24: 2.3 Spracherkennung 2.3.4.2 Signala
Seite 25 und 26: 2.3 Spracherkennung Ein Phonem‐Mo
Seite 27 und 28: 2.3 Spracherkennung Zunächst wird
Seite 29 und 30: 2.4 Sprachsynthese Die Entwicklung
Seite 31 und 32: 2.4 Sprachsynthese Ziel‐Prosodie
Seite 33 und 34: 2.5 VoiceXML 2.5.4 Weitere VoiceXML
Seite 35: 3.1 Rahmenbedingungen 3 Implementie
Seite 39 und 40: 3.2 Vorstellung der Komponenten Bei
Seite 41 und 42: 3.2 Vorstellung der Komponenten 3.2
Seite 43 und 44: 3.2 Vorstellung der Komponenten 3.
Seite 45 und 46: 3.2 Vorstellung der Komponenten 3.2
Seite 47 und 48: 3.3 Vorbereitungen Die Archivdatei
Seite 49 und 50: 3.3 Vorbereitungen Im Dialog System
Seite 51 und 52: 3.3 Vorbereitungen Auf dem Entwickl
Seite 53 und 54: 3.3 Vorbereitungen Abbildung 33: Im
Seite 55 und 56: 3.3 Vorbereitungen Abbildung 36: Au
Seite 57 und 58: 3.3 Vorbereitungen Nun kann der Que
Seite 59 und 60: 3.3 Vorbereitungen Abbildung 40: Ei
Seite 61 und 62: 3.4 Verbinden der Komponenten Als n
Seite 63 und 64: 3.4 Verbinden der Komponenten 3.4.1
Seite 65 und 66: 3.4 Verbinden der Komponenten 3.4.1
Seite 67 und 68: 3.4 Verbinden der Komponenten numBy
Seite 69 und 70: 3.4 Verbinden der Komponenten // nu
Seite 71 und 72: 3.4 Verbinden der Komponenten Die I
Seite 73 und 74: 3.4 Verbinden der Komponenten Die A
Seite 75 und 76: 3.4 Verbinden der Komponenten Abbil
Seite 77 und 78: 3.4 Verbinden der Komponenten Nach
Seite 79 und 80: 3.5 Anpassung Wort‐basierte Erken
Seite 81 und 82: 3.5 Anpassung Drückt der Benutzer
Seite 83 und 84: 3.5 Anpassung Ist eine DTMF‐Erken
Seite 85 und 86: 3.6 Erstellen eines Beispieldialogs
Seite 87 und 88:
3.6 Erstellen eines Beispieldialogs
Seite 89 und 90:
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Seite 99 und 100:
Seite 101 und 102:
Seite 103 und 104:
4 Zusammenfassung Die Ursache dafü
Seite 105 und 106:
5 Verbesserungsmöglichkeiten Mehrb
Seite 107 und 108:
6 Literaturverzeichnis [Spr08] —.
Seite 109 und 110:
7 Abbildungsverzeichnis 7 Abbildung
Seite 111 und 112:
Anhang Anhang A Inhalt der CD Die n
Alle anzeigen

DIPLOMARBEIT

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?