05.03.2014 Aufrufe

Hauptseminar:”Sprachsynthese“ - IPdS in Kiel

Hauptseminar:”Sprachsynthese“ - IPdS in Kiel

Hauptseminar:”Sprachsynthese“ - IPdS in Kiel

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

WS 2004/05, Dozent: Dr. H.R. Pfitz<strong>in</strong>ger<br />

Ort: Schell<strong>in</strong>gstr. 3, HS 230<br />

Zeit: 2stündig, Mo. 14-16 Uhr<br />

Beg<strong>in</strong>n: Mo., 18.10.04<br />

<strong>Hauptsem<strong>in</strong>ar</strong>: ”<br />

Sprachsynthese“<br />

1 Inhalt<br />

Gegenstand dieser Veranstaltung s<strong>in</strong>d geschichtlicher H<strong>in</strong>tergrund und Methoden der masch<strong>in</strong>ellen<br />

Erzeugung von Sprachsignalen. Obwohl die Forschung auf dem Gebiet der Sprachsynthese<br />

bereits e<strong>in</strong>e lange Tradition vorzuweisen hat, s<strong>in</strong>d erst <strong>in</strong> den letzten Jahren kommerzielle<br />

Systeme erschienen, die e<strong>in</strong>e akzeptable Sprachverständlichkeit und -natürlichkeit bieten. Diese<br />

Systeme, die im wesentlichen auf der Wiedergabe von Aufzeichnungen natürlicher Äußerungen<br />

basieren, werden vertieft behandelt.<br />

Das <strong>Hauptsem<strong>in</strong>ar</strong> beschäftigt sich aber mit allen relevanten Verarbeitungse<strong>in</strong>heiten e<strong>in</strong>es typischen<br />

Sprachsynthesesystems. Hierzu zählt die symbolische Vorverarbeitung der Texte<strong>in</strong>gabe<br />

(Homographen-Disambiguierung, Graphem-Phonem-Konvertierung, Regeln lernen), die Generierung<br />

von Steuerparametern (Modelle zur Intonationsgenerierung) und die eigentliche Erzeugung<br />

des Sprachsignals (Formantsynthese, Vergleich aktueller Synthesesysteme). Insbesondere<br />

die Techniken der Konkatenativen Sprachsynthese (Dynamic Programm<strong>in</strong>g, PSOLA, Spektrale<br />

Glättung) wie auch Techniken zur Aufbereitung e<strong>in</strong>es passenden Synthesekorpus werden hier<br />

behandelt (Greedy, Automatische Segmentierung).<br />

Zur Vertiefung der Inalte dieses <strong>Hauptsem<strong>in</strong>ar</strong>s wird das ergänzende Sem<strong>in</strong>ar ” Übung zum HS<br />

Sprachsynthese“ angeboten und auch dr<strong>in</strong>gend empfohlen.<br />

1.1 Voraussetzungen:<br />

• Erfolgreiche Zwischenprüfung<br />

• Interesse an masch<strong>in</strong>eller Symbol- und Signalverarbeitung (NLP und SLP)<br />

1.2 Erfolgreiche Teilnahme:<br />

• Regelmäßige Anwesenheit<br />

• 60m<strong>in</strong>ütiges Referat<br />

• Schriftliche Ausarbeitung


2 Inhalt<br />

Datum Vorträge Referenten<br />

18.10.04 Vorbesprechung Pfitz<strong>in</strong>ger<br />

25.10.04 E<strong>in</strong>führung <strong>in</strong> die Sprachsynthese Pfitz<strong>in</strong>ger<br />

8.11.04 Geschichte der Sprachsynthese Pfitz<strong>in</strong>ger<br />

15.11.04 Vergleich aktueller Synthesesysteme Kar<strong>in</strong> Hoegner<br />

22.11.04 Der Greedy“-Algorithmus Matthias Marhofer<br />

”<br />

29.11.04 Zwischenstand; Dynamic Programm<strong>in</strong>g, PSOLA Pfitz<strong>in</strong>ger<br />

13.12.04 Graphem-Phonem-Konvertierung Uwe Reichel<br />

17.1.05 Formantsynthese Stefanie Schatz<br />

24.1.05 Modelle zur Intonationsgenerierung Natascha Kühnert<br />

31.1.05 Homograph-Disambiguierung Joanna Rymarska<br />

7.2.05 Spektrale Glättung Sanela Zunic<br />

14.2.05 Zusatzterm<strong>in</strong>e:<br />

12–14 Uhr: Automatische Segmentierung Christian He<strong>in</strong>rich<br />

14–16 Uhr: Regeln lernen Maria Paola Bissiri<br />

3 Vorträge<br />

Dauer des Vortrags: 60 M<strong>in</strong>uten. Dauer der Diskussion: bis zu 30 M<strong>in</strong>uten. Vorträge sollen<br />

mit Overheadfolien oder PDF-Präsentation oder PowerPo<strong>in</strong>t-Präsentation begleitet werden. Die<br />

verwendete Literatur soll als Kopiervorlage <strong>in</strong> den Sem<strong>in</strong>arordner <strong>in</strong> der Bibliothek spätestens<br />

e<strong>in</strong>e Woche vor dem Vortrag geheftet werden.<br />

4 Schriftliche Ausarbeitungen<br />

Seitenanzahl: Insgesamt 10 bis 15 Seiten. Seitenformat: DIN A4. Schriftgröße: 12 Punkt. Titelblatt<br />

enthält: Sem<strong>in</strong>artitel und Datum, Name des Referenten, Titel des Vortrags, viertel- bis<br />

halbseitige Zusammenfassung. Vollständige Literaturangaben am Ende der Ausarbeitung.<br />

Abzugeben ist e<strong>in</strong> PDF-Dokument sowie das zugrundeliegende Word- oder TeX-Dokument und<br />

alle Bilder.<br />

Spätester Abgabeterm<strong>in</strong> für die Ausarbeitung ist: Montag, der 28.02.05

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!