DIPLOMARBEIT
DIPLOMARBEIT
DIPLOMARBEIT
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
3.1 Rahmenbedingungen<br />
Die Vorteile von Eclipse sind:<br />
36<br />
• kostenlos<br />
• ständige Verbesserungen dank Open‐Source<br />
• Unterstützung einer Vielzahl von Programmiersprachen<br />
• Echtzeit‐Syntax‐Überprüfung<br />
• Anpassung der dargestellten Informationen durch sog. Views und Perspektiven<br />
• Erweiterbarkeit durch Plug‐Ins<br />
• Für viele Plattformen verfügbar, da auf JAVA basierend<br />
3.1.4 Betriebssystem<br />
Als Betriebssystem wird, sowohl für die Entwicklung als auch für die Anwendung selbst, Microsoft<br />
Windows XP verwendet. Der Grund dafür ist, dass auf den Rechnern, die für die Entwicklung zur Ver‐<br />
fügung stehen, Windows XP bereits installiert ist. Auch im späteren Gebrauchsumfeld stehen Rech‐<br />
ner mit Windows XP zur Verfügung.<br />
Dank der Portierbarkeit, die JAVA mit sich bringt, ist es auch denkbar, dass die Anwendung später auf<br />
Linux‐Rechnern eingesetzt wird. Dazu wären voraussichtlich nur minimale Änderungen nötig.<br />
3.1.5 Grundkonzept<br />
Das Grundkonzept ist recht einfach: Der VoIP‐Client wird beim Start des Sprachservers geladen.<br />
Wenn eine VoIP‐Verbindung besteht, dann werden die ankommenden Audiodaten zum Sprachserver<br />
umgeleitet. Der Sprachserver verwendet für die Erkennung nun diese umgeleiteten Daten, anstatt<br />
derjenigen, die vom Audioeingang der Soundkarte kommen.<br />
Genauso sendet der VoIP‐Client nun nicht mehr die Daten, die vom Audioeingang kommen, sondern<br />
die Daten, die von der Sprachsynthese ausgegeben werden.<br />
3.2 Vorstellung der Komponenten<br />
3.2.1 Der Sprachserver<br />
3.2.1.1 Einleitung<br />
Der Sprachserver, auch als Friedberger Sprachserver (FBSV) bezeichnet, ist eine JAVA‐Anwendung,<br />
die von Prof. Dr. Stephan Euler entwickelt wurde. Der Zweck des Sprachservers ist es, Sprachdialoge<br />
mittels Spracherkennung und Sprachsynthese zu ermöglichen.<br />
Die Funktion des Sprachservers kann grob in vier Komponenten unterteilt werden:<br />
1. Der VoiceXML‐Parser, der Dialoge in Form von VoiceXML‐Dateien abarbeitet<br />
2. Der Wortgrenzendetektor, der eine Äußerung des Benutzers aufzeichnet und dabei Anfang<br />
und Ende erkennt<br />
3. Der Spracherkenner, der die Äußerung analysiert und die wahrscheinlichste Antwort zurück‐<br />
liefert<br />
4. Die Sprachsynthese, die Textausgaben in Audiosignale umwandelt und ausgibt