7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden
7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden
7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Technische</strong> <strong>Universität</strong> <strong>Dresden</strong><br />
Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />
Institut für Akustik <strong>und</strong> Sprachkommunikation<br />
Jahresbericht 2004<br />
Berichtszeitraum 1.1.2004 bis 31.12.2004
Postanschrift (Briefe):<br />
<strong>Technische</strong> <strong>Universität</strong> <strong>Dresden</strong><br />
Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />
Institut für Akustik <strong>und</strong> Sprachkommunikation<br />
01062 <strong>Dresden</strong><br />
Postanschrift (Pakete):<br />
Helmholtzstr. 10<br />
01069 <strong>Dresden</strong><br />
Besucheradresse:<br />
Helmholtzstr. 18<br />
Barkhausen-Bau<br />
Sekretariat: Zi. 54<br />
Telefon: ++49 - 351 - 463 37510 (Sekretariat)<br />
++49 - 351 - 463 32747 (Institutsdirektor)<br />
Fax: ++49 - 351 - 463 37781<br />
E-Mail: Ruediger.Hoffmann@ias.et.tu-dresden.de<br />
2
Inhaltsverzeichnis<br />
Inhaltsverzeichnis<br />
Inhaltsverzeichnis ....................................................................................................... 3<br />
Vorwort ....................................................................................................................... 5<br />
1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter des Instituts für Akustik <strong>und</strong><br />
Sprachkommunikation ..................................................................................... 7<br />
1.1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „<strong>Technische</strong> Akustik“........................ 7<br />
1.2 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „Systemtheorie <strong>und</strong><br />
Sprachkommunikation“ .................................................................................... 8<br />
2 Lehre................................................................................................................ 9<br />
2.1 Vorlesungen, Übungen, Praktika ..................................................................... 9<br />
2.2 <strong>Studienarbeiten</strong>.............................................................................................. 11<br />
2.3 <strong>Diplom</strong>arbeiten............................................................................................... 11<br />
2.4 Studienwerbung............................................................................................. 12<br />
2.5 Führungen mit Demonstrationen ................................................................... 12<br />
2.6 Umsetzung des akustischen Modells der Semperoper .................................. 13<br />
3 Forschung...................................................................................................... 14<br />
3.1 AG „<strong>Technische</strong> Akustik“ ............................................................................... 14<br />
3.2 AG „Systemtheorie <strong>und</strong> Sprachkommunikation“ ............................................ 28<br />
4 Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung ................................... 48<br />
4.1 Drittmittelprojekte........................................................................................... 48<br />
4.2 Haushaltfinanzierte Forschungsaufgaben...................................................... 50<br />
5 Veröffentlichungen ......................................................................................... 51<br />
5.1 Bücher, Buchbeiträge .................................................................................... 51<br />
5.2 Veröffentlichungen in Zeitschriften................................................................. 51<br />
5.3 TU-Informationen <strong>und</strong> Lehrmaterial ............................................................... 51<br />
5.4 Vortragsveröffentlichungen ............................................................................ 52<br />
5.5 Vorträge (ungedruckt) .................................................................................... 55<br />
5.6 Patente .......................................................................................................... 56<br />
5.7 Forschungsberichte ....................................................................................... 56<br />
5.8 Veröffentlichungen in Zeitungen <strong>und</strong> anderen Medien................................... 57<br />
5.9 Messeteilnahmen........................................................................................... 57<br />
6 Promotionen <strong>und</strong> Habilitationen..................................................................... 58<br />
3
Inhaltsverzeichnis<br />
7 <strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong> ......................................................................... 59<br />
7.1 <strong>Diplom</strong>arbeiten............................................................................................... 59<br />
7.2 <strong>Studienarbeiten</strong>.............................................................................................. 59<br />
8 Wissenschaftliche Veranstaltungen ............................................................... 60<br />
8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem Lothar-<br />
Cremer-Preis der Deutschen Gesellschaft für Akustik im Jahre 2004 ........... 60<br />
8.2 Konferenz „Elektronische Sprachsignalverarbeitung“,<br />
Cottbus, 20. bis 22. September 2004............................................................. 61<br />
8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“<br />
am 8. Dezember 2004 ................................................................................... 62<br />
8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“ ........................... 63<br />
9 Institutskolloquien .......................................................................................... 63<br />
10 Reisen............................................................................................................ 64<br />
11 Aktivitäten in der wissenschaftlichen Gemeinschaft....................................... 69<br />
11.1 Akademische Selbstverwaltung ..................................................................... 69<br />
11.2 Mitarbeit in Gremien....................................................................................... 69<br />
11.3 Mitarbeit in Programmkomitees ..................................................................... 70<br />
4
Vorwort<br />
Vorwort<br />
Der 1990 aufgenommenen Tradition folgend, legt das Institut für Akustik <strong>und</strong> Sprachkommunikation<br />
seinen Partnern <strong>und</strong> Fre<strong>und</strong>en hiermit seinen 15. Jahresbericht vor.<br />
Auch in diesem Jahresbericht kann wieder eine positive Bilanz der Aktivitäten in Lehre <strong>und</strong> Forschung<br />
gezogen werden. Zu dem Blick auf das vergangene Jahr gehört aber auch, dass wir am 5. Juli 2004<br />
die traurige Nachricht erhielten, dass der langjährige Inhaber der Professur für Sprachkommunikation,<br />
Herr<br />
Prof. Dr.-Ing. habil. Walter Tscheschner,<br />
nach kurzer, schwerer Krankheit verstorben ist. Wir verdanken seinem Wirken den Aufbau des<br />
sprachtechnologischen Teiles unseres Instituts. Als 1968 das damalige Institut für <strong>Technische</strong> Akustik<br />
durch Hinzunahme weiterer Institutsteile zum Wissenschaftsbereich Kommunikation <strong>und</strong> Messwerterfassung,<br />
dem Vorgänger unseres heutigen Instituts, erweitert wurde, erfolgte damit an der TU <strong>Dresden</strong><br />
eine bemerkenswert frühzeitige Institutionalisierung der Mensch-Technik-Schnittstelle als Forschungsobjekt.<br />
Es war ein glücklicher Umstand, dass für die Komponente der Sprachkommunikation<br />
Walter Tscheschner zur Verfügung stand, der mit seinen Arbeiten über das Sprachsignal eine Entwicklungslinie<br />
zur Spracherkennung <strong>und</strong> -synthese begründete, die in unserem heutigen Institut kontinuierlich<br />
weitergeführt wird. Wir haben ihn wegen seiner herausragenden menschlichen <strong>und</strong> wissenschaftlichen<br />
Qualitäten hoch geschätzt <strong>und</strong> werden sein Andenken in Ehren halten.<br />
Im Berichtsjahr wechselte der bisherige Inhaber der Professur für <strong>Technische</strong> Akustik, Herr Prof. Dr.-<br />
Ing. habil. Peter Költzsch, zum Ende des WS 2003/04 in den Ruhestand. Über das Ehrenkolloquium<br />
zu seinem 65. Geburtstag konnte bereits im vorhergehenden Jahresbericht berichtet werden. Er war<br />
ein Jahrzehnt an unserem Institut tätig, <strong>und</strong> wir danken ihm für seine erfolgreiche Arbeit in Lehre <strong>und</strong><br />
Forschung <strong>und</strong> für seine engagierte Tätigkeit als Institutsdirektor. Wie man aus diesem Jahresbericht<br />
sieht, ist er weiterhin bei der Betreuung verschiedener Drittmittelprojekte aktiv tätig.<br />
Wie auch schon im Jahresbericht 2003 mitgeteilt werden konnte, war es trotz widriger Haushaltlage<br />
möglich, die freiwerdende Akustikprofessur unter der modifizierten Bezeichnung Kommunikationsakustik<br />
zur Nachbesetzung auszuschreiben. Im Berichtsjahr legte die Berufungskommission, die aus<br />
Vertretern eines breiten Fachspektrums zusammengesetzt war, einstimmig einen Listenvorschlag vor.<br />
Die Staatsministerin für Wissenschaft <strong>und</strong> Kunst ist diesem Vorschlag gefolgt <strong>und</strong> hat im Dezember<br />
2004 den Ruf an Frau Prof. Dr. phil. habil. Ute Jekosch erteilt. Sie ist derzeit Inhaberin einer Professur<br />
für Psychoakustik <strong>und</strong> So<strong>und</strong>design an der School of Architecture des Rensselaer Polytechnic Institute,<br />
Troy, NY.<br />
Es besteht also (trotz aller anders lautenden Gerüchte <strong>und</strong> Zweifel, die sich im vergangenen Jahr<br />
leider in der Fachwelt ausbreiteten) aller Gr<strong>und</strong> zum Optimismus, dass die Dresdner Akustik bald wieder<br />
in voller personeller <strong>und</strong> wissenschaftlicher Stärke aufgestellt sein wird. An dieser Stelle möchte<br />
ich besonders Herrn Prof. Dr.-Ing. habil. Günther Pfeifer danken, der zwischenzeitlich die Leitung der<br />
Akustikprofessur kommissarisch wahrnimmt <strong>und</strong> bereitwillig zusätzliche, umfangreiche Aufgaben in<br />
der Lehre übernommen hat. Das Institut kann dadurch auch im Übergangszeitraum, in dem die Akustikprofessur<br />
noch nicht wieder besetzt ist, seine Pflichtaufgaben in der Lehre ohne Abstriche erfüllen<br />
<strong>und</strong> zusätzlich ein breites Wahlprogramm für das Hauptstudium anbieten.<br />
Eine zusätzliche Verbreiterung der wissenschaftlichen Basis unseres Instituts wird sich durch eine<br />
vertiefte Kooperation mit dem Institut für Musikinstrumentenbau in Zwota ergeben. Mit diesem traditionsreichen<br />
Institut aus dem vogtländisch-erzgebirgischen Musikwinkel bestand bereits vor Jahren<br />
eine Zusammenarbeit auf dem Gebiet der Psychoakustik, die nun wieder aufgenommen werden soll.<br />
Der organisatorische Rahmen ist dadurch gegeben, dass die Trägereinrichtung des Instituts, der Vogtländische<br />
Förderverein für Musikinstrumentenbau <strong>und</strong> Innovation e. V. (VFMI), mit Wirkung vom<br />
2. 11. 2004 als An-Institut unserer <strong>Universität</strong> anerkannt ist. Diese Vereinbarung geht auf eine gemeinsame<br />
Initiative des VFMI, der Fakultät Elektro- <strong>und</strong> Informationstechnik, der Fakultät Maschinenwesen<br />
<strong>und</strong> der Fakultät Forst-, Geo- <strong>und</strong> Hydrowissenschaften zurück.<br />
Diese Vertiefung der Beziehungen zur Musikinstrumenten-Industrie ist ein aktuelles Beispiel für die<br />
Einbindung des Instituts in Gremien, Kooperationen <strong>und</strong> Förderprojekte, die Voraussetzung für die<br />
erfolgreiche Arbeit des Instituts ist. Wir danken allen Partnern, die uns auf vielfältige Weise unterstützt<br />
5
Vorwort<br />
haben. Ein besonderer Dank gilt wieder Frau Wilhelmine Willkomm für die stetige Förderung des wissenschaftlichen<br />
Nachwuchses.<br />
Ich möchte auch nicht versäumen, meinen Dank bei meiner langjährigen Sekretärin, Frau Uta Haase,<br />
die zum 31. März 2004 in den Ruhestand ging, abzustatten. Sie hat die Arbeitsgruppe „Systemtheorie<br />
<strong>und</strong> Sprachkommunikation“ seit 1993 mit Umsicht, Sachkenntnis, Geduld <strong>und</strong> Fre<strong>und</strong>lichkeit betreut.<br />
Für die Zukunft wünschen wir ihr alles Gute, Ges<strong>und</strong>heit <strong>und</strong> Freude.<br />
Auch in dem nun begonnenen Jahr 2005 werden die Aufgaben nicht weniger werden. Die Fakultät<br />
Elektrotechnik <strong>und</strong> Informationstechnik hat zum laufenden Wintersemester die wiederum gestiegene<br />
Zahl von 575 Studierenden immatrikuliert, so dass die Lehrnachfrage weiter gesichert ist. In der Forschung<br />
wird es neben der Weiterführung der bestehenden Projekte darum gehen, neue Vorhaben zu<br />
akquirieren, um die wissenschaftliche Arbeit weiter finanzieren zu können. In der Professur Kommunikationsakustik<br />
werden das Projekte sein, die zur Gestaltung des neuen fachlichen Profils beitragen. In<br />
der Professur Sprachkommunikation zeichnet sich u. a. eine neue vertragliche Zusammenarbeit mit<br />
osteuropäischen Partnern ab.<br />
Beim Blick auf das vor uns liegende Jahr muss die Konferenz „Elektronische Sprachsignalverarbeitung“<br />
erwähnt werden. Unser Institut ist seit 1990 an dieser jährlichen Veranstaltung beteiligt, die bisher<br />
an wechselnden Orten in Deutschland stattfand. Durch eine bereitwillige Zusage von Herrn Dr.-<br />
Ing. Dr.-Ing. E. h. R. Vích von der Tschechischen Akademie der Wissenschaften wird die 16. Konferenz<br />
in diesem Jahr im historischen Ambiente des Liechtenstein-Palais in Prag stattfinden. Sie wird<br />
vereinigt mit dem 15. Tschechisch-Deutschen Workshop „Speech Processing“ durchgeführt. Die Serie<br />
dieser Workshops pflegt besonders die Kooperation zwischen Phonetikern <strong>und</strong> Ingenieuren, die somit<br />
auch einen Schwerpunkt unserer Konferenz bilden wird. Ich bin sicher, dass der glanzvolle Ort der<br />
Konferenz diesmal eine besondere Anziehungskraft beweisen wird, <strong>und</strong> lade Sie herzlich ein, die Veranstaltung<br />
durch Ihre aktive Teilnahme auch inhaltlich zu einem Höhepunkt werden zu lassen. Der<br />
Termin ist der 26. - 28. September 2005. Nähere Informationen finden Sie unter<br />
www.ias.et.tu-dresden.de/essv2005 oder www.ias.et.tu-dresden.de/essp2005.<br />
Zum Konferenzgeschehen kann weiter berichtet werden, dass sich unser Institut im Jahre 2004 an der<br />
internationalen Ausschreibung zur Konferenz Speech Prosody 2006 beteiligt <strong>und</strong> den Zuschlag bekommen<br />
hat. Wir freuen uns über diesen Erfolg besonders deshalb, weil es erstmals gelungen ist,<br />
eine größere internationale Konferenz an unser Institut zu holen, <strong>und</strong> danken allen Fachkollegen <strong>und</strong><br />
Institutionen, die diese Bewerbung unterstützt haben. Die Konferenz ist eine Veranstaltung der SPro-<br />
SIG (ISCA Special Interest Group on Speech Prosody) <strong>und</strong> wird vom 2. bis zum 5. Mai 2006 im neu<br />
errichteten Konferenzzentrum am <strong>Dresden</strong>er Elbufer stattfinden. Nähere Informationen bietet<br />
www.ias.et.tu-dresden.de/sp2006.<br />
Am Ende dieser einführenden Worte soll ein kleiner Hinweis zur Traditionspflege stehen. Unser Institut<br />
bewahrt das Gipsmodell der <strong>Dresden</strong>er Semperoper, das für die akustische Projektierung des Wiederaufbaus<br />
des 1945 zerstörten, legendären Opernhauses angefertigt wurde. Seit 2004 steht es öffentlich<br />
zugänglich im Eingangsbereich des Institutes. Über die vorher erforderliche Restaurierung des<br />
Modells wird in diesem Jahresbericht in Abschnitt 2.6 berichtet. Ein schöner Zufall wollte es, dass<br />
etwa zeitgleich der Mitteldeutsche R<strong>und</strong>funk an einem Fernsehbeitrag über den 1985 abgeschlossenen<br />
Wiederaufbau der Oper arbeitete <strong>und</strong> dabei Herrn Professor Kraak um Erläuterungen zur akustischen<br />
Komponente bat. So war es möglich, ihn <strong>und</strong> das erneuerte Modell am 29. Dezember 2004 am<br />
Bildschirm in einem Beitrag zu erleben, der neben der Sachinformation auch das sprichwörtliche<br />
<strong>Dresden</strong>er Traditionsbewusstsein zum Ausdruck brachte.<br />
Allen Mitgliedern <strong>und</strong> Fre<strong>und</strong>en unseres Instituts wünsche ich ein erfolgreiches <strong>und</strong> ges<strong>und</strong>es Jahr<br />
2005.<br />
Im Januar 2005 Rüdiger Hoffmann<br />
6
Mitarbeiterinnen <strong>und</strong> Mitarbeiter<br />
1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter des Instituts für Akustik<br />
<strong>und</strong> Sprachkommunikation<br />
Institutsdirektor<br />
Prof. Dr.-Ing. habil. Rüdiger Hoffmann<br />
1.1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „<strong>Technische</strong> Akustik“<br />
Hochschullehrerinnen <strong>und</strong> Hochschullehrer<br />
Prof. Dr.-Ing. habil. Peter Költzsch Leiter der AG (bis 31.03.2004)<br />
im Ruhestand (ab 01.04.2004)<br />
Telefon<br />
33041<br />
apl. Prof. Dr.-Ing. habil. Günther Pfeifer Leiter der AG (ab 01.04.2004)<br />
bis zur Wiederbesetzung<br />
32205<br />
Doz. Dr.-Ing. habil. Elfgard Kühnicke 32894<br />
Prof. Dr.-Ing. habil. Wolfgang Kraak im Ruhestand seit 1988<br />
Prof. Dr.-Ing. habil Arno Lenk im Ruhestand seit 1996<br />
Prof. Dr.-Ing. habil Walter Wöhle im Ruhestand seit 1993<br />
Wissenschaftliche Mitarbeiter<br />
Dr.-Ing. Günther Fuder 35374<br />
Wissenschaftliche Mitarbeiterinnen <strong>und</strong> Mitarbeiter auf Drittmittelstellen, Doktoranden<br />
Dipl.-Ing. Marcus Bauer DFG 33041<br />
Dr.-Ing. Volker Bormann (bis 31.05.2004) B<strong>und</strong>esanstalt f. AuA, BBAW u. a. 32509<br />
Dipl.-Ing. Haike Brick DFG 34294<br />
Dipl.-Ing Stefan Folprecht (bis 30.11.2004) DFG 32253<br />
Dipl.-Ing Jörn Hübelt (bis 31.10.2004) DFG/FhG 32449<br />
Dipl.-Ing. Björn Knöfel BMBF 35524<br />
Dr.-Ing. Rafael Piscoya Rodriguez DFG 35524<br />
Dipl.-Ing. Dietmar Richter DFG/Microtech Gefell GmbH 32275<br />
Dipl.-Ing. Eric Starke (ab 01.10.2004) SFB 639 32253<br />
Dipl.-Ing. Andreas Zeibig DFG/DLR 32509<br />
Ingenieure<br />
Dipl.-Ing. (FH) Jürgen Landgraf 33521<br />
Dipl.-Ing. Andreas Witing 33547<br />
Promotionsstudenten/Stipendiaten<br />
Dipl.-Ing. Stephan Leschka (bis 30.04.2004) 32253<br />
Sekretärin/Institutssekretariat<br />
Frau Lianne Domaschke 37510<br />
7
Mitarbeiterinnen <strong>und</strong> Mitarbeiter<br />
1.2 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „Systemtheorie <strong>und</strong><br />
Sprachkommunikation“<br />
Hochschullehrer<br />
Telefon<br />
Prof. Dr.-Ing. habil. Rüdiger Hoffmann Leiter der AG 32747<br />
Prof. em. Dr.-Ing. habil. Dieter Mehnert Externer Mitarbeiter<br />
Wissenschaftliche Mitarbeiter<br />
Dr.-Ing. Ulrich Kordon 32240<br />
Dipl.-Ing. Matthias Eichner (bis 30.09.2004) anschließend GWT 36298<br />
Dipl.-Ing. Mathias Kortke 34849<br />
Dr.-Ing. Matthias Wolff 36298<br />
Projektmanager Signalverarbeitung <strong>und</strong> Mustererkennung der Gesellschaft für Wissens- <strong>und</strong><br />
Technologietransfer mbH der TU <strong>Dresden</strong><br />
Dipl.-Ing. Oliver Jokisch 32289<br />
Ingenieure<br />
Dipl.-Ing. Steffen Kürbis 33395<br />
Dipl.-Ing. (FH) Margitta Lachmann GWT 34283<br />
Mitarbeiter auf Drittmittelstellen bzw. Promotionsstudenten<br />
Dipl.-Ing. Maximiliano Cuevas DFG 34839<br />
Dr. phil. Hongwei Ding GWT 34283<br />
Dr.-Ing. Ute Feldmann Habil.-Stipendiatin 32721<br />
MSc. Hamurabi Gamboa Rosales Stipendiat 33106<br />
Dipl.-Ing. Hussein Hussein Stipendiat 32721<br />
Dipl.-Slaw. Rainer Jäckel GWT 32799<br />
MSc. Toshifumi Oba DFG 33106<br />
Dipl.-Ing. Guntram Strecha Siemens 34849<br />
Dipl.-Inf. Constanze Tschöpe DFG (FhG) 34839<br />
Dipl.-Ing. Steffen Werner DFG 32799<br />
Sekretärinnen<br />
Frau Uta Haase (bis 31.03.2004) 37656<br />
Frau Barbara Wrann 37656<br />
8
2 Lehre<br />
Lehre<br />
2.1 Vorlesungen, Übungen, Praktika<br />
Im Sommersemester 2004 <strong>und</strong> im Wintersemester 2004/2005 wurden die folgenden Lehrveranstaltungen<br />
durchgeführt:<br />
2.1.1 Pflichtfächer im Gr<strong>und</strong>- <strong>und</strong> Hauptstudium<br />
Vorlesung „Systemtheorie I“ (Prof. R. Hoffmann) WS 04/05<br />
2 SWS Vorlesung,1 SWS Übung 3. Semester<br />
Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 550 Hörer<br />
<strong>und</strong> Nebenfach<br />
Vorlesung „Systemtheorie II“ (Prof. R. Hoffmann) SS 04<br />
2 SWS Vorlesung,2 SWS Übung 4. Semester<br />
Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 450 Hörer<br />
<strong>und</strong> Nebenfach<br />
Vorlesung „Systemtheorie III“ (Prof. R. Hoffmann) WS 04/05<br />
2 SWS Vorlesung, 2 SWS Übung 5. Semester<br />
Studienrichtung Informationstechnik 80 Hörer<br />
Vorlesung „Signal Processing“ (Prof. R. Hoffmann) SS 04<br />
2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />
Master-Studiengang 5 Hörer<br />
Vorlesung „Signalverarbeitung“ (Prof. R. Hoffmann) WS 04/05<br />
2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />
Studienrichtung Informationstechnik, Studiengang Informationssystemtechnik, 100 Hörer<br />
Master-Studiengang <strong>und</strong> Nebenfach<br />
Vorlesung „Akustik“ (Prof. G. Pfeifer) WS 04/05<br />
2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />
Studienrichtung Informationstechnik, Bakkalaureat Informations- <strong>und</strong> 67 Hörer<br />
Mikroelektronik, Nebenfach für Medieninformatik <strong>und</strong> Informatik,<br />
Master-Studiengang<br />
Praktikum „Computertechnik“ (Mitwirkung) SS 04<br />
Studiengang Elektrotechnik 2. Semester<br />
Versuch “Beurteilung der Klangfarbe von überlagerten Sinustönen”<br />
(Dipl.-Ing. A. Witing) 65 Teilnehmer<br />
Versuch „Akustischer Schalter“ (Dr. Kordon <strong>und</strong> Mitarb.) 80 Teilnehmer<br />
2.1.2 Wahlobligatorische Fächer (AG <strong>Technische</strong> Akustik)<br />
Vorlesung „<strong>Technische</strong> Akustik“ (Prof. G. Pfeifer) SS 04<br />
2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />
13 Hörer<br />
Vorlesung „Elektroakustik I“ (Prof. G. Pfeifer) SS 04<br />
2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />
18 Hörer<br />
Vorlesung „Theoretische Akustik“ (Doz. Dr. Kühnicke) SS 04<br />
2 SWS Vorlesung 8. Semester<br />
5 Hörer<br />
9
Lehre<br />
Vorlesung „Raumakustik <strong>und</strong> Beschallungstechnik“ (Dr. Ederer/Dr. Roy) SS 04<br />
2 SWS Vorlesung 8. Semester<br />
16 Hörer<br />
Vorlesung „Ultraschall II“ (Doz. Dr. E. Kühnicke) SS 04<br />
2 SWS Vorlesung 8. Semester<br />
5 Hörer<br />
Vorlesung „Elektromechanische Messtechnik“ (Prof. G. Pfeifer) SS 04<br />
2 SWS Vorlesung 6./8. Semester<br />
4 Hörer<br />
Vorlesung „Mechanische <strong>und</strong> elektronische Klangerzeugung SS 04<br />
bei Musikinstrumenten“ (Doz. Dr. E. Kühnicke) 40 Hörer<br />
2 SWS Vorlesung<br />
Praktikum „Computertechnik“ (Dipl.-Ing. A. Witing) SS 04<br />
Studiengang Elektrotechnik 2. Semester<br />
Versuch „Beurteilung der Klangfarbe von überlagerten Sinustönen“ 48 Hörer<br />
Praktikum „Akustik“ WS 04/05<br />
(Prof. R. Hoffmann/Prof. P. Költzsch/Prof. G. Pfeifer) 7. Semester<br />
4 SWS Praktikum (Dr. Fuder) 10 Hörer<br />
Seminar „Schallmesspraxis“ (Dr. G. Fuder) WS 04/05<br />
1 SWS Seminar, 1 SWS Praktikum 7. Semester<br />
18 Hörer<br />
Vorlesung „Elektroakustik II“ (Prof. G. Pfeifer) WS 04/05<br />
2 SWS Vorlesung, 2 SWS Übung 7. Semester<br />
7 Hörer<br />
Vorlesung „Ultraschall I – Gr<strong>und</strong>lagen“ (Doz. Dr. E. Kühnicke) WS 04/05<br />
2 SWS Vorlesung 7. Semester<br />
12 Hörer<br />
2.1.3 Wahlobligatorische Fächer (AG Systemtheorie <strong>und</strong><br />
Sprachkommunikation)<br />
Vorlesung „Signalanalyse <strong>und</strong> –erkennung“ (Prof. Hoffmann) SS 04<br />
2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />
15 Hörer<br />
Vorlesung „Psychoakustik“ (Dr. Kordon) SS 04<br />
2 SWS Vorlesung 6. Semester<br />
74 Hörer<br />
Vorlesung „<strong>Technische</strong> Sprachkommunikation“ (Dr. Kordon) SS 04<br />
2 SWS Vorlesung 6. Semester<br />
21 Hörer<br />
Praktikum „<strong>Technische</strong> Sprachkommunikation“ (Dr. Kordon) WS 04/05<br />
3 SWS Praktikum 7. Semester<br />
9 Teilnehmer<br />
Vorlesung „Spracherkennung I“ (Dr. Kordon) WS 04/05<br />
2 SWS Vorlesung 7. Semester<br />
10 Hörer<br />
10
Lehre<br />
Vorlesung „Spracherkennung II“ (Dr. Flach, FhG) SS 04<br />
2 SWS Vorlesung 8. Semester<br />
4 Hörer<br />
Vorlesung „Sprachsynthese“ (Dr. Kordon) WS 04/05<br />
1 SWS Vorlesung 7. Semester<br />
26 Hörer<br />
Seminar „Signalprozessoren in der Audio-Signalverarbeitung“ (Dipl.-Ing. Kürbis) WS 04/05<br />
1 SWS Seminar, 1 SWS Praktikum 7. Semester<br />
10 Hörer<br />
Vorlesung „Chaos/Nichtlineare Systeme“ (Dr. Feldmann) WS 04/05<br />
2 SWS Vorlesung 7 Semester<br />
8 Hörer<br />
Hauptseminar „Systemtheorie/Sprachtechnologie“ (Prof. Hoffmann/Dr. Feldmann) WS 04/05<br />
1SWS Seminar 7 Semester<br />
5 Teilnehmer<br />
2.1.4 Lehrveranstaltungen für andere Studiengänge<br />
Vorlesung „Elektromechanische Netzwerke“ (Prof. G. Pfeifer) WS 04/05<br />
2 SWS Vorlesung, 1 SWS Übung 7. Semester<br />
Fakultät Elektrotechnik, Studiengang Mechatronik 17 Hörer<br />
Vorlesung „Musikalische Akustik/Physiologische Akustik“ SS 04<br />
(Dipl.-Phys. A. Wilde, Prof. G. Hofmann) 47 Hörer<br />
1 SWS Vorlesung<br />
Fakultät Informatik/Nebenfach für Studiengang Medieninformatik <strong>und</strong> Informatik<br />
Vorlesung „Physikalische Gr<strong>und</strong>lagen der Akustik“ (Doz. Dr. E. Kühnicke) WS 04/05<br />
2 SWS Vorlesung, 1 SWS Übung 3. Semester<br />
Fakultät Informatik/Studiengang Medieninformatik <strong>und</strong> Informatik 56 Hörer<br />
Vorlesung „Signale <strong>und</strong> Systeme“ (Dr. U. Feldmann) SS 04<br />
2 SWS Vorlesung, 1 SWS Seminar, 1 SWS Praktikum 4. Semester<br />
Berufsakademie Sachsen (BA), Informationstechnik 37 Hörer<br />
2.2 <strong>Studienarbeiten</strong><br />
Im Berichtszeitraum wurden am Institut für Akustik <strong>und</strong> Sprachkommunikation 10 <strong>Studienarbeiten</strong><br />
angefertigt. Die Themen, die Bearbeiter <strong>und</strong> die Betreuer der Arbeiten sind im Abschnitt 7.2 aufgeführt.<br />
2.3 <strong>Diplom</strong>arbeiten<br />
Im Jahr 2003 wurden am Institut für Akustik <strong>und</strong> Sprachkommunikation 9 <strong>Diplom</strong>arbeiten verteidigt.<br />
Zwei ausländische Studenten fertigten ihre <strong>Diplom</strong>arbeiten am Institut an. Diese wurden jeweils an der<br />
Heimatuniversität verteidigt. Die Themen, die Bearbeiter <strong>und</strong> die Betreuer aller <strong>Diplom</strong>arbeiten sind im<br />
Abschnitt 7.1 zusammengestellt.<br />
11
2.4 Studienwerbung<br />
Lehre<br />
• Schnupperstudium am 15. Januar 2004<br />
Vorlesungen<br />
Vorlesung Akustik (mit Experimenten) Prof. Költzsch<br />
Besichtigungen<br />
Labor für Spracherkennung <strong>und</strong> –synthese Dr. U. Kordon<br />
Audioschallerzeugung mittels Ultraschall Dipl.-Ing. S. Folprecht<br />
Akustische Messräume (schalltoter Raum <strong>und</strong> Hallraum, Dipl.-Ing. A. Witing/<br />
Audio-/video-Labor, Experimente im aerodynamischen Windkanal) Dipl.-Ing. D. Richter/<br />
Dipl.-Ing. A. Zeibig<br />
Akustisches Modell der Semperoper <strong>Dresden</strong> Dipl.-Ing. D. Richter<br />
� „Uni-Tag“ am 24. April 2004<br />
Besichtigungen/ Vorführungen:<br />
Labor für Spracherkennung <strong>und</strong> Sprachsynthese Dr. U. Kordon<br />
Modell der Semperoper <strong>Dresden</strong> Dr. G. Fuder<br />
Hallraum, großer schalltoter Raum Dipl.-Ing. A. Witing<br />
• Sommeruniversität 2004<br />
Es fanden vier Veranstaltungen im Juli 2004 (08.07., 15.07., 22.07., 29.07.2004) im Rahmen der<br />
Sommeruniversität statt.<br />
Einführungsvorträge: „Einführung in die Akustik“ Dr. Fuder<br />
„Sprachanalyse <strong>und</strong> Sprachsynthese“ Dr. Kordon<br />
Besichtigungen:<br />
Labor für Spracherkennung <strong>und</strong> Sprachsynthese, Modell der Semperoper<br />
Akustische Messräume: Hallraum, großer schalltoter Raum, Windkanal<br />
Teilnehmer: jeweils 2 Gruppen (insgesamt 33 Abiturientinnen, Schülerinnen <strong>und</strong> Schüler)<br />
• Betreuung von Schülern<br />
Vier Schüler der 9. Klasse absolvierten am Institut ein zweiwöchiges Betriebspraktikum. In dieser Zeit<br />
wurden u.a.eine Multimedia-CD zur akustischen Erprobung der Semperoper erstellt <strong>und</strong> grafische<br />
Vorlagen zur Ansteuerung eines historischen Sprachsynthesesystems erarbeitet.<br />
2.5 Führungen mit Demonstrationen<br />
Die Teilnehmer erhielten eine Einführung in die Struktur sowie die fachlichen Aufgaben des Instituts<br />
<strong>und</strong> lernten die Studien- <strong>und</strong> Forschungsmöglichkeiten am Institut kennen. Es wurden akustische<br />
Spezialräume <strong>und</strong> Labors besichtigt sowie Verfahren der Sprachsynthese/Sprachanalyse<br />
demonstriert.<br />
• Führung von 80 Schülern des Gymnasiums Klotzsche<br />
Termin: 01.10.2004<br />
• Führung von 50 Schülern des Gymnasiums Klotzsche<br />
Termin: 04.10.2004<br />
� Einen besonderen Besucheransturm von über 300 Besuchern erlebte das Institut anlässlich der<br />
„Langen Nacht der Wissenschaften“, die am 25. Juni 2004, die gemeinsam von den Dresdner<br />
Wissenschaftseinrichtungen organisiert worden war.<br />
Unter der Überschrift „Experimente im Akustiklabor“ wurden<br />
o die Besichtigung des großen reflexionsarmen Raumes mit Demonstration des synthetischen<br />
Schallfeldes – Simulation des Höreindrucks in Räumen <strong>und</strong><br />
o Experimente im Spracherkennungs- <strong>und</strong> Sprachsyntheselabor<br />
angeboten.<br />
12
Lehre<br />
2.6 Umsetzung des akustischen Modells der Semperoper<br />
Das Modell entspricht im Maßstab 1:20 dem Zustand des Zuschauerraumes der Semperoper vor der<br />
Zerstörung im II. Weltkrieg <strong>und</strong> diente der Ermittlung der ursprünglichen raumakustischen Kennwerte.<br />
Heute wird das Modell zur Erklärung der Modellmesstechnik innerhalb von Institutsführungen verwendet.<br />
Vor seiner Umsetzung stand das Opernmodell im so genannten Modellmessraum. Da dieser<br />
Raum gegenwärtig für andere Forschungsvorhaben genutzt wird <strong>und</strong> um dem Modell einen würdigeren<br />
Rahmen zu geben, sollte es in das Treppenfoyer im Sockelgeschoss des Barkhausenbaus umgesetzt<br />
werden. Nach Abnahme der Modellmaße wurde klar, dass das Modell durch keine Tür im Hause<br />
passt. In seiner Weitsicht bei der Projektierung des Modellmessraumes hatte Prof. W. Reichardt ein<br />
großes Fenster mit einer demontierbaren Mittelstrebe ausführen lassen, um große Modelle rein- <strong>und</strong><br />
rauszutransportieren. Also hätten auch wir das Modell aus dem Barkhausenbau wieder herausbekommen<br />
– aber eben nicht wieder in das Foyer herein. So musste es also in mehrere Teile zerlegt<br />
werden. Da dies bei der Kompliziertheit der filigranen Gipskonstruktion kein einfaches Unterfangen<br />
war, zogen wir Experten zu Rate. Besonders den Fähigkeiten des bekannten Dresdner Bildhauers<br />
Vincenz Wanitschke ist es zu danken, dass die Zerlegung <strong>und</strong> Montage des Opernmodells gelang.<br />
Bildhauer Vincenz Wanitschke vor dem zerlegten Modell <strong>und</strong> aufgereihte Einzelteile<br />
Heute können wir das durch Institutsmitarbeiter eingehauste Modell wieder in voller Schönheit im Foyer<br />
bew<strong>und</strong>ern. Zwei außen angebrachte Poster informieren zur Historie <strong>und</strong> zur Modellmesstechnik.<br />
Prof. W. Kraak, Leiter der akustischen Untersuchungen der Semperoper, vor dem Modell<br />
Prof. W. Kraak hielt am 9. Dezember 2004 im Rahmen der Vorlesung „Akustik“ einen Vortrag zum<br />
Thema: „Akustik der Semperoper“.<br />
(Dipl.-Ing. J. Landgraf)<br />
13
3 Forschung<br />
3.1 AG „<strong>Technische</strong> Akustik“<br />
3.1.1 Verbrennungslärm<br />
Forschung<br />
Verbrennungslärm: Schallabstrahlung offener Jet–Diffusionsflammen<br />
In den ersten zwei Jahren des Forschungsprojektes „Modellierung der Schallabstrahlung von Flammen<br />
mit akustischen Ersatzstrahlern“ wurde vor allem die Anwendbarkeit der Ersatzstrahlermethode,<br />
/3/, (ESM) für freie Flammen untersucht. Parallel wurde ein Bo<strong>und</strong>ary-Elemente-Methode, /4/, (BEM)–<br />
Code entwickelt, um die Ergebnisse der ESM-Berechnungen verifizieren zu können. Das Forschungsprojekt<br />
ist ein Teilprojekt der von der DFG geförderten, überregionalen Forschergruppe „Combustion<br />
Noise“ /1/.<br />
Die Berechnung der Schallabstrahlung erfolgt nach einem Hybridverfahren, welches aus zwei Schritten<br />
besteht: 1.) die Bestimmung der akustischen Größen im Nahfeld <strong>und</strong> 2.) die Berechnung des<br />
Schallfeldes im Fernfeld. Der Gr<strong>und</strong> dieser Teilung liegt im Unterschied der Zeit-, Raum- <strong>und</strong> Energieskalen<br />
von Strömung <strong>und</strong> Schallausbreitung begründet. In der Strömung befinden sich kleine Strukturen<br />
mit viel Energie, die sich mit kleiner konvektiver Geschwindigkeit ausbreiten. Der abgestrahlte<br />
Schall hat kleine Amplituden <strong>und</strong> trägt wenig Energie, besitzt aber große Wellenlängen aufgr<strong>und</strong> der<br />
hohen Ausbreitungsgeschwindigkeit.<br />
Die Schnelle im Nahfeld, d.h. der erste Schritt des Verfahrens, wird mit Hilfe einer Large-Eddy-<br />
Simulation berechnet, die das kooperierende Teilprojekt „Modellierung von Schallquellen in Verbrennungssystemen<br />
mit Hilfe der Grobstruktursimulation“ an der TU Darmstadt, Fachgebiet Energie- <strong>und</strong><br />
Kraftwerkstechnik, durchführt.<br />
Nach einer Anpassung der geometrischen LES-Rechengitter an die Anforderungen der ESM bzw.<br />
BEM <strong>und</strong> der Fouriertransformation der Schnelledaten im Zeitbereich in Schnellespektren kann das<br />
Schallfeld im Fernfeld bestimmt werden.<br />
Zur Validierung der Ergebnisse wurde die abgestrahlte Schallleistung der simulierten Flammen mit der<br />
Intensitätsmessmethode am Darmstädter Institut vermessen. Abb.1 zeigt den Brenner <strong>und</strong> das Messgitter.<br />
Abbildung 1 Messung der<br />
Schallleistung der Jet-<br />
Diffusionsflamme (HD-<br />
Flamme) mit der Intensitätsmessmethode<br />
Die untersuchte Diffusionsflamme ist durch die folgenden Größen charakterisiert: Brennstoff 23% H2 /<br />
77% N2, Re = 16.000, Düsendurchmesser D = 8 mm,<br />
Austrittsgeschwindigkeit Ubulk = 36,3 m/s (HD-Flamme in /2/).<br />
In Abb. 2 sind die Messergebnisse für die HD-Flamme sowie die Berechnungsergebnisse der beiden<br />
akustischen Methoden dargestellt. Es ist zu sehen, dass die Simulationen die tatsächliche Schallabstrahlung<br />
der Flamme überschätzen, <strong>und</strong> zwar um maximal 5 dB. Der qualitative Verlauf der Kurve<br />
wird im tieferen <strong>und</strong> mittleren Frequenzbereich mit der BEM erstaunlich gut wiedergegeben. Die Ergebnisse<br />
der ESM weichen im tieferen Frequenzbereich etwas stärker von der gemessenen Kurve ab,<br />
14
Forschung<br />
die Ursache ist in der schlechten Konditionierung des Gleichungssystems bei tieferen Frequenzen zu<br />
suchen.<br />
Abbildung 2<br />
Terzspektren der abgestrahlten<br />
Schallleistung der HD-<br />
Flamme,<br />
– gemessen, -- mit BEM <strong>und</strong><br />
.- mit ESM berechnet.<br />
Ab ca. 2000 Hz folgen die simulierten Kurven nicht mehr dem Abfall des gemessenen Frequenzganges.<br />
Die Ursachen für diese Abweichungen konnten bisher nicht abschließend geklärt werden. Auch<br />
andere Autoren beschreiben das Auftreten dieses hochfrequenten Störlärms bei Berechnung der<br />
Schallabstrahlung auf der Gr<strong>und</strong>lage von Large-Eddy-Simulationen /5/. Eine Untersuchung der möglichen<br />
Ursachen für diese signifikante qualitative Abweichung sowie die Erweiterung der Methoden auf<br />
die Berechnung der Schallabstrahlung eingeschlossener Flammen ist für die folgende Projektphase<br />
geplant.<br />
(Dipl.-Ing. Haike Brick, Dr.-Ing. Rafael Piscoya)<br />
3.1.2 Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen<br />
<strong>und</strong> Oberflächendruckfelder (SWING+)<br />
Im Rahmen des DFG-Paketantrages „Numerische Aeroakustik für Verkehrsflugzeuge (SWING+)“<br />
wurde im Zeitraum von 2001 bis 2004 das Projekt Schallquellenmodellierung mittels stochastischer<br />
Geschwindigkeitsschwankungen <strong>und</strong> Oberflächendruckfelder“ bearbeitet (Dr. Nikolai Kalitzin, Dipl.-<br />
Ing. Marcus Bauer, Dipl.-Ing. Andreas Zeibig, Dipl.-Ing. Dietmar Richter, Dipl.-Ing. Andreas Witing, Dr.<br />
Andriy Borisyuk), <strong>und</strong> zwar gemeinsam mit den Partnern: Institut für Aerodynamik <strong>und</strong> Gasdynamik<br />
der <strong>Universität</strong> Stuttgart, Aero-dynamisches Institut der RWTH Aachen, Hermann-Föttinger- Institut für<br />
Strömungsmechanik der TU Berlin, Institut für Aerodynamik <strong>und</strong> Strömungstechnik des DLR Braunschweig.<br />
Die Zielsetzung des TU-Projektes war die Weiterentwicklung, Verifizierung <strong>und</strong> Validierung des<br />
SNGR-Modells für einen CAA-Code <strong>und</strong> dessen exemplarische Anwendung zur Berechnung des Geräusches<br />
der Klappenseitenkantenströmung bzw. deren einzelnen Modellstufen.<br />
Arbeitshypothesen:<br />
- EULER-Gleichungen mit Quellgliedern können zur Berechnung strömungsakustischer Felder<br />
eingesetzt werden. Eine Aufspaltung der Variablen in einen zeitgemittelten <strong>und</strong> einen<br />
Schwankungsanteil ist sinnvoll.<br />
- Reale Turbulenz kann im Hinblick auf das o. g. Ziel durch stochastische, synthetische Geschwindigkeitsschwankungen<br />
unter Verwendung klassischer Turbulenzspektren<br />
(z. B. von-Kármán-Spektrum) nachgebildet werden.<br />
- Druckfelder auf der Oberfläche bzw. im Nahbereich von umströmten Körpern bilden prinzipiell<br />
das akustische Quellgeschehen ab <strong>und</strong> sind deshalb zur Quellmodellierung bei hybriden Verfahren<br />
(Aeroakustische Analogie) einsetzbar.<br />
- Numerische Verfahren <strong>und</strong> deren Lösungen gewinnen erst dadurch an Bedeutung, dass ihre<br />
Ergebnisse durch Messungen validiert worden sind.<br />
15
Forschung<br />
- Zur Validierung der Projektergebnisse sind aerodynamische, strömungsakustische <strong>und</strong> akustische<br />
Messungen durchzuführen. Dafür sind geeignete Messmethoden <strong>und</strong> Versuchsaufbauten<br />
zu realisieren bzw. neu zu entwickeln.<br />
In den drei Hauptabschnitten des TU-Projektes wurden folgende Ergebnisse erreicht:<br />
Schallquellenmodellierung: stochastische Geschwindigkeitsschwankungen (numerisches Verfahren:<br />
CAA-Modul: SNGR)<br />
Das ursprüngliche SNGR-Modell (Stochastic Noise Generation and Radiation) weist einige Unzulänglichkeiten<br />
auf: anfechtbare Gr<strong>und</strong>gleichungen, Vermischung von Schall- <strong>und</strong> Turbulenzvorgängen,<br />
keine Störschallvermeidung (Störschall entsteht beim örtlichen Ein- <strong>und</strong> Ausblenden eines Quellterms<br />
im CAA-Rechengebiet, dadurch entscheidende Beeinflussung der Güte der Simulationsergebnisse).<br />
Deshalb musste das SNGR-Modell modifiziert werden. Danach wird der Schall nicht mehr direkt durch<br />
den Quellterm erzeugt, sondern indirekt durch Wechselwirkung der Turbulenz, die der Quellterm in<br />
den EULER-Gleichungen generiert, mit der Tragflügelhinterkante.<br />
Zu den Details: Der lineare Quellterm („Shear-Term“) erzeugt bei etwa 100 Moden für die synthetische<br />
Turbulenz deutlich mehr (indirekten) Schall als die nichtlineare Quelle („Self-Term“); außerdem ist die<br />
Störschallvermeidung mittels einer Gewichtsfunktion <strong>und</strong> die Vermeidung von Instabilitätswellen, die<br />
später Quellen für Störschall am Ausströmrand sind, mit dem linearen Term besser möglich. Das modifizierte<br />
von-Kármán Spektrum ist zur Generierung der synthetischen Turbulenz geeignet. Durch die<br />
Verwendung zusätzlicher Quellgebiete, beispielsweise eines zweiten Gebietes unter der Hinterkante,<br />
wurde gezeigt, dass sich bei dünner Kante Hinterkantenlärm vermeiden lässt, wenn die Turbulenz auf<br />
beiden Seiten des Objektes spiegelsymmetrisch zueinander ist (künstlich herbeigeführter Fall).<br />
Das modifizierte SNGR-Verfahren ist nunmehr prinzipiell geeignet, den Hinterkantenlärm vorauszuberechnen,<br />
siehe dazu z. B. die erfolgreiche Validierung bzw. Verifizierung von berechneten Richtcharakteristiken<br />
der Schallabstrahlung. Für eine exakte Vorhersage der Absolutwerte der abgestrahlten<br />
Schalldruckpegel sind allerdings noch weiterführende Untersuchungen zum SNGR-Modell notwendig.<br />
Das Quellmodell mit stochastischen Geschwindigkeitsschwankungen (SNGR-Modell) wurde als zusätzliches<br />
Modul in den CAA-Code PIANO [Delfs, Grogger, Lauke et al.] des DLR raunschweig implementiert.<br />
Eine wichtige Gr<strong>und</strong>lage dieses Codes ist das hochgenaue Finite-Differenzen Schema von<br />
Tam <strong>und</strong> Webb.<br />
Schallquellenmodellierung: Oberflächendruckfelder (analytisches Verfahren)<br />
Es wurde ein analytisches Berechnungsverfahren für die Ermittlung des Zusammenhanges zwischen<br />
den Wanddruckschwankungen in der Nähe der Hinterkante <strong>und</strong> dem Fernschallfeld entwickelt. Der<br />
Vorteil eines solchen Verfahrens besteht darin, dass damit sehr verschiedenartig gewonnene Daten<br />
über die Wanddruckfelder als Schallquellenmodell verwendet werden können, <strong>und</strong> zwar empirische/halbempirische<br />
Modelle für die Wanddruckfelder (CORCOS, FFOWCS WILLIAMS,<br />
SMOL’YAKOV-TKACHENKO, CHASE u. a.), Wanddruckfelder aus numerischen Simulationen (z. B.<br />
aus LES, SNGR/LEE) <strong>und</strong> gemessene Wanddruckfelder (Messergebnisse zu den turbulenten Druckschwankungen<br />
bei überströmten Oberflächen, Umströmungskörpern <strong>und</strong> Abreißgebieten).<br />
Für bestimmte Strömungsfälle wurden die Fernfeld-Schalldruckspektren für verschiedene Wanddruckmodelle<br />
berechnet. Dabei zeigen alle Modelle sehr ähnliche Ergebnisse: der Hinterkantenlärm<br />
wird durch die konvektiven Wanddruckkomponenten beherrscht, die erfahrungsgemäß durch alle Modelle<br />
gleich gut beschrieben werden. Die Validierung dieses Rechenverfahrens steht noch aus.<br />
Validierung/Messungen<br />
Es ist von prinzipieller Bedeutung, die Validierung numerischer Simulationen <strong>und</strong> analytischer Rechenverfahren<br />
weiterzuentwickeln. Diese Erkenntnis resultiert aus der Beobachtung, dass gegenwärtig<br />
<strong>und</strong> in den letzten Jahren bei der Entwicklung numerischer Verfahren durch den rasanten Fortschritt<br />
in der Computertechnik eine extrem hohe Fortschrittsrate festzustellen ist, im Gegensatz dazu<br />
aber die für wissenschaftliche Arbeitsweise notwendige messtechnische Validierung weitestgehend<br />
nur kümmerlich behandelt wird. Deshalb muss einerseits insbesondere der Entwicklung bzw. Weiterentwicklung<br />
aerodynamischer, aeroakustischer <strong>und</strong> akustischer Messverfahren erhöhte Aufmerksamkeit<br />
geschenkt werden, andererseits aber auch dem methodischen Problem, Validierungsexperimente<br />
zu entwickeln, die auf die numerischen <strong>und</strong> analytischen Berechnungsfälle zugeschnitten sind.<br />
Während der Projektbearbeitung wurde der aeroakustische Windkanal des Instituts für die geplanten<br />
Validierungsmessungen optimiert (Einbau eines leistungsfähigeren Antriebs zum Erreichen höherer<br />
16
Forschung<br />
Strömungsgeschwindigkeiten, verbesserte Schallschutzmassnahmen zur weiteren Unterdrückung des<br />
Störgeräusches in der Messkammer).<br />
Die Validierungsmethoden für den Vergleich zwischen den numerischen/analytischen Rechenergebnissen<br />
<strong>und</strong> den Messergebnissen wurden systematisiert; neue Messmethoden wurden angewendet<br />
(Messung der Richtcharakteristik von Hinterkantenlärm am physikalischen Modell des Tragflügels im<br />
schalltoten Raum) sowie bestehende Messmethoden weiterentwickelt <strong>und</strong> verbessert (Mikrofonarray:<br />
Anwendung der Frequenzbandmittelung).<br />
Zu den Details: Mit der entwickelten <strong>und</strong> erprobten Messtechnik konnten sowohl Strömungs- als auch<br />
Schalldaten an verschieden Mess- <strong>und</strong> Rechenmodellen validiert werden. Am Beispiel von ebener<br />
Platte <strong>und</strong> NACA0012-Profil wurden erfolgreich RANS-Rechnungen mit Ergebnissen von Hitzdrahtmessungen<br />
verglichen. Die Hinterkante des NACA 0012 – Profils wurde mit dem entwickelten Mikrofonarray<br />
eindeutig als aeroakustische Hauptschallquelle identifiziert <strong>und</strong> ihre Schallabstrahlung quantitativ<br />
bestimmt. Die numerisch <strong>und</strong> analytisch berechnete Richtcharakteristik der Schallabstrahlung am<br />
Profil NACA0012 bzw. am Plattenmodell konnte sowohl durch Schalldruckmessungen im aeroakustischen<br />
Windkanal als auch durch Messungen am physikalischen Modell im schallreflexionsarmen<br />
Raum validiert werden.<br />
Durch detaillierte Untersuchungen von Beamforming-Algorithmen <strong>und</strong> Mikrofonarray-geometrien<br />
konnten über den allgemeinen Wissensstand hinausgehende Erkenntnisse über den Aufbau, die Optimierung<br />
<strong>und</strong> die praktische Anwendung von Mikrofonarrays gewonnen werden. Ein wichtiges Ergebnis<br />
sind die Ergebnisse hinsichtlich der Anwendung von neuen <strong>und</strong> weiterentwickelten Algorithmen bei<br />
Berücksichtigung der Messung von Absolutwerten. Zur Unterdrückung von störenden Nebenkeulen<br />
wird in Frequenzbändern gemittelt. Durch Untersuchung <strong>und</strong> Optimierung verschiedener Mikrofonanordnungen<br />
wurde eine angepasste Arraygeometrie, bestehend aus zwei Kreisringen, entwickelt.<br />
3.1.3 Akustische Simulationsverfahren (AKUSIM)<br />
(P. Költzsch, M. Bauer, A. Zeibig)<br />
AKUSIM (Akustische Simulationsverfahren) ist ein Teilprojekt des BMBF-Verb<strong>und</strong>projektes "Leiser<br />
Verkehr". Ziel dieses Vorhabens ist die Schaffung <strong>und</strong> Bereitstellung von Berechnungswerkzeugen für<br />
den akustisch optimalen Entwurf von typischen Fahrzeugstrukturen.<br />
Strömungsschall<br />
Im Rahmen des AKUSIM - Arbeitspaketes "Strömungsgeräusch – Wanddruckschwankungen" beschäftigt<br />
sich das <strong>IAS</strong> speziell mit dem Umströmungsgeräusch starrer Bauteile, welches beim Hochgeschwindigkeitsverkehr<br />
(PKW, Bahn, Flugzeug) eine erhebliche Belastung der Bevölkerung <strong>und</strong> der<br />
Reisenden darstellt. Dazu werden am <strong>IAS</strong> sowohl numerische Berechnungen als auch Messungen<br />
(zur Validierung der berechneten Ergebnisse) durchgeführt.<br />
Eine computergestützte akustische Optimierung von Bauteilen im Hinblick auf das von ihnen verursachte<br />
Umströmungsgeräusch ist durch eine direkte numerische Lösung der entsprechenden Gr<strong>und</strong>gleichungen<br />
(Navier-Stokes-Gleichungen, NSG) mit den heute verfügbaren Rechnerressourcen nicht<br />
möglich. Am <strong>IAS</strong> wird deshalb ein hybrides Verfahren verwendet, welches zwei vereinfachte Formen<br />
der NSG kombiniert. Im ersten Schritt werden die sog. RANS-Gleichungen (Reynolds Averaged Navier<br />
Stokes, zeitgemittelte NSG) mit dem CFD (Computational Fluid Dynamics) Code FLOWer des<br />
DLR (Deutsches Zentrum für Luft- <strong>und</strong> Raumfahrt) berechnet <strong>und</strong> die zeitabhängige Turbulenz als<br />
Schallquelle wird mittels statistischer Information aus der RANS- Lösung synthetisch erzeugt [1]. Im<br />
zweiten Schritt werden durch den CAA (Computational Aero-Acoustics) Code PIANO des DLR modifizierte<br />
Formen der Eulergleichungen (NSG ohne Reibung) gelöst, die von einem Quellterm angeregt<br />
werden. Dieser wird im Quellgebiet aus der synthetischen Turbulenz berechnet.<br />
17
Forschung<br />
Abbildung 3 Rechenergebnisse für eine Stufe mit rs = h/2 bei einer Anströmgeschwindigkeit von 50<br />
m/s: zeitgemittelte Strömung aus FLOWer (links) <strong>und</strong> Momentaufnahme des LEE-<br />
Schwankungsdruckes aus einer PIANO Testrechnung (rechts).<br />
Ziel der numerischen Untersuchungen am <strong>IAS</strong> ist die Vorausberechnung des Umströmungsgeräusches<br />
einer vorwärtsgeneigten Stufe als typisches Bauteil von Verkehrsmitteln (Beispiel: Fensterdichtungen).<br />
Dabei werden die Anströmgeschwindigkeit <strong>und</strong> die Stufenform variiert <strong>und</strong> zwei Modifikationen<br />
der Eulergleichungen, nämlich die Linearisierten Eulergleichungen (LEE) einerseits, sowie die<br />
Acoustic Perturbation Equations (APE) [2] andererseits, getestet.<br />
Abbildung 3 zeigt im linken Bild einen Ausschnitt der berechneten zeitgemittelten Strömung um eine<br />
Stufe mit der Höhe h = 12 mm <strong>und</strong> einem Krümmungsradius rs = h/2 bei einer Anströmgeschwindigkeit<br />
von 50 m/s (Ma = 0,147). Es sind Isoflächen der lokalen Machzahl Ma <strong>und</strong> ausgewählte Stromlinien<br />
dargestellt.<br />
Im rechten Bild ist eine Momentaufnahme des Schwankungsdruckes einer anschließenden instationären<br />
LEE-Testrechnung für diesen Fall zu sehen. Bei Verwendung der LEE befindet sich das Quellgebiet<br />
stromauf der Stufe <strong>und</strong> soll dort (möglichst leise) turbulente Fluktuationen anregen. Weil die zeitgemittelte<br />
Strömung in den Koeffizienten der LEE enthalten ist, folgen diese dann den Stromlinien, um<br />
schließlich an der Stufe den gesuchten Lärm zu erzeugen. Man erkennt sowohl die kleinskaligen turbulenten<br />
Fluktuationen im Bereich des Quellgebietes, als auch die Schallwellen.<br />
Zur Validierung der numerischen Untersuchungen werden am aeroakustischen Windkanal des Institutes<br />
Messungen an ausgewählten Teststrukturen durchgeführt <strong>und</strong> mit den Rechenergebnissen der<br />
Projektpartner verglichen. Zur Validierung aeroakustischer Simulationen ist insbesondere bei der Berechnung<br />
mit hybriden Methoden notwendig, sowohl Strömungs- als auch Schallfeldgrößen zu vergleichen.<br />
CSD in dB<br />
5<br />
0<br />
-5<br />
-10<br />
-15<br />
-20<br />
-25<br />
-30<br />
ohne Tripping<br />
mit Tripping<br />
-35<br />
50 100 200<br />
Frequenz in Hz<br />
500 1000<br />
Abbildung 4 Skizze der Fahrzeugmodellstruktur mit eingebauten Druckaufnehmern (K2-K4) ohne<br />
Endkappen (links) <strong>und</strong> Kreuzspektrum des Fernfeldschalldrucks <strong>und</strong> des von Druckaufnehmer 3 aufgezeichnete<br />
Wanddrucksignals (rechts, Modell jeweils ohne <strong>und</strong> mit Tripping, Anströmgeschwindigkeit<br />
vAnström = 34 m/s, p0 = 20 µPa)<br />
18
Forschung<br />
Als Teststruktur für die Messungen im Windkanal wurde eine generische Fahrzeugstruktur vom Typ<br />
„Strebe“ gewählt. Diese Fahrzeugstruktur besteht aus einem Halbzylinder mit angesetztem Heckdreikant<br />
variabler Länge <strong>und</strong> steht repräsentativ für eine ganze Reihe von aerodynamischen Schallquellen<br />
an Fahrzeugen, so. z.B. für Stromabnehmer (Bahn) <strong>und</strong> Fahrwerkskomponenten.<br />
An dieser Strebe wurden für verschiedene Heckdreikantlängen Messungen der hydro-dynamischen<br />
Wanddruckschwankungen, Hitzdrahtmessungen zur Bestimmung des Geschwindigkeitsfeldes in der<br />
Grenzschicht <strong>und</strong> im Nachlauf der umströmten Struktur sowie Schalldruckmessungen an ausgewählten<br />
Punkten im akustischen Fernfeld durchgeführt.<br />
Die Messungen der von Strömungs- <strong>und</strong> Schallfeldgrößen wurde zumindest teilweise simultan durchgeführt<br />
Damit war eine Untersuchung der Korrelation zwischen Strömungs- <strong>und</strong> Schallfeld [3] möglich,<br />
welche Rückschlüsse auf die Ursachen der Schallentstehung zuließ.<br />
Ein Bild der aufgebauten Teststruktur <strong>und</strong> das Ergebnis einer Kreuzkorrelation zwischen einem<br />
Wanddruckaufnehmer (K3) <strong>und</strong> einem Fernfeldmikrofon sind in Abbildung 4 dargestellt. Bei einigen<br />
messtechnischen Untersuchungen war zur gezielten Erzeugung der turbulenten Überströmung der<br />
Modellstruktur ein Trippstreifen an der Abrisskante des Modells (Übergang Halbzylinder – Heckdreikant)<br />
angebracht.<br />
In den bisher durchgeführten Untersuchungen war es möglich, zusätzlich zu der erwarteten Ausbildung<br />
einer Karman’schen Wirbelstraße („Querresonanz“) eine weitere hydrodynamische Instabilität<br />
(„Längsresonanz“) zu finden, welche unter bestimmten Bedingungen auch zur Schallabstrahlung führen<br />
kann [4]. Beschreibungen dieser Schwingungsform aus der Literatur sind bisher nicht bekannt,<br />
allerdings wurde in den numerischen Untersuchungen des Projektpartners DLR bei bestimmten Heckdreikantlängen<br />
eine ähnliche Schwingungsform entdeckt.<br />
[1] R. H. Kraichnan: Diffusion by a Random Velocity Field. The Physics of Fluids, Vol. 13, No. 1, pp.<br />
22-31, 1970<br />
[2] R. Ewert et. al.: Computation of Trailing Edge Noise via LES and Acoustic Perturbation Equations.<br />
AIAA-Paper 2002-2467, American Institute for Aeronautics and Astronautics, 2002.<br />
[3] Mueller, T. J. (Ed.).: Aeroacoustic Measurements. 1. Auflage. Berlin/Heidelberg. Springer-Verlag ,<br />
2002<br />
[4] Achilles, S.: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellstrukturen. <strong>Diplom</strong>arbeit,<br />
TU <strong>Dresden</strong>, Institut für Akustik <strong>und</strong> Sprachkommunikation, 2004<br />
(Dipl.-Ing. A. Zeibig, Dipl.-Ing. M. Bauer)<br />
Körperschall-Energieflussmethode<br />
Bei der Konstruktion von Fahrzeugen besteht eine wesentliche Aufgabe in der Berechnung der<br />
Schallabstrahlung <strong>und</strong> der Fahrzeugschwingungen. Die Statistische Energieanalyse (SEA), eine Berechnungsmethode<br />
für mittlere <strong>und</strong> hohe Frequenzen, weist bei ihren Vorhersagen oft einige Einschränkungen<br />
auf, die vor allem aus ihrem statistischen Charakter resultieren. Aus diesem Hintergr<strong>und</strong><br />
heraus werden nicht nur Erweiterungsmöglichkeiten zur SEA betrachtet, sondern es gibt verschiedene<br />
Bestrebungen, alternative Berechnungs-verfahren zu untersuchen. Eine der alternativen<br />
Theorien ist in eine Bo<strong>und</strong>ary Element Method integriert <strong>und</strong> basiert auf der lokalen Energieerhaltung<br />
in einem System.<br />
Diese Methode, die High Frequency Bo<strong>und</strong>ary Element Method (HFBEM), ist in einem Computerprogramm<br />
umgesetzt worden, dass die Schwingungsberechnung von punktförmig angeregten ebenen<br />
Strukturen, die aus beliebig vielen Einzelstrukturen bestehen, gestattet.<br />
Um dieses Verfahren nicht nur mit der SEA hinsichtlich ihres Konvergenzverhaltens zu vergleichen,<br />
sondern auch mit Messwerten von realen Strukturen, erfolgte bereits im letzten Jahr die Definition von<br />
drei fahrzeugtypischen Anwendungsfällen <strong>und</strong> die Konstruktion dieser in Form von drei generischen<br />
Fahrzeugstrukturen. Die Abbildungen 5 - 7 zeigen ein PKW-Bodenblech, den Hochflurbereich eines<br />
Regionalzuges in einem vereinfachten Aufbau, sowie eine verrippte Aluminiumplatte.<br />
19
Forschung<br />
Abbildung 5 PKW-Bodenblech Abbildung 6 Verripte Platte<br />
Abbildung 7<br />
Hochflurbereich eines Regionalzuges<br />
Berechnungen <strong>und</strong> Messungen:<br />
An allen 3 Strukturen erfolgten bereits Messungen des Schallübertragungsverhaltens, wobei hier stellvertretend<br />
einige Ergebnisse der verrippten Platte vorgestellt werden. In Abbildung 8 ist diese mit<br />
Längs- <strong>und</strong> Querversteifungen dargestellt, wobei die definierten Messpfade (L1,L2, Q0,Q1,Q2,Q3)<br />
eingezeichnet sind.<br />
20<br />
Abbildung 8 Messanordnung<br />
der verrippten Platte<br />
Während des Projektes liegt ein Schwerpunkt auf der Vorhersage<br />
von fahrzeugspezifischen Änderungen, d.h. inwieweit die<br />
HFBEM das Schwingungsverhalten der Strukturen vorhersagen<br />
kann, wenn an diesen praxisrelevante Änderungen<br />
durchgeführt wurden. Für die verrippte Platte fanden Messungen<br />
mit den Längs- <strong>und</strong> Querversteifungen, mit Längs- oder<br />
Querversteifungen, sowie ohne Versteifungen statt. Dabei<br />
wurde die Position der Messpfade beibehalten. Die Quelle bestand<br />
in Form eines elektromechanischen Schwingerregers,<br />
der die Platte zu Biegeschwingungen anregt.<br />
In den Abbildungen 9 <strong>und</strong> 10 sind die Ergebnisse der Frequency<br />
Response Function FRF = 10 log (v²/P) dB für den<br />
Messpfad Q2 bei 8 kHz der unversteiften Platte (Abbildung 9),<br />
sowie der längsversteiften Platte (Abbildung 10) dargestellt. In<br />
beiden Fällen wurde deutlich, dass die HFBEM erst bei hohen<br />
Dämpfungen (1% bei 8 kHz) den erwarteten Pegelabfall quantitativ<br />
widerspiegelt.
Forschung<br />
Bei geringeren Frequenzen ist die Materialdämpfung teilweise wesentlich kleiner als 1 %, wodurch die<br />
HFBEM ähnlich „glatte“ Verläufe wie die SEA prognostiziert. Im Falle der versteiften Platte (Abbildung<br />
10) berechnet die HFBEM einen der Messung vergleichbaren Pegelverlauf, der durch die zusätzliche<br />
– <strong>und</strong> in der Rechnung noch nicht berücksichtigte – Dämpfung durch die Versteifungen geringfügig<br />
über den Messwerten liegt.<br />
FRF 10 log (v² / P )dB<br />
0<br />
-10<br />
-20<br />
-30<br />
-40<br />
Messung HFBEM<br />
SEA<br />
-50<br />
0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80<br />
Abbildung 9 unversteifte Platte, f = 8kHz<br />
FRF 10 lg (v² / P) dB<br />
0<br />
-10<br />
-20<br />
-30<br />
-40<br />
Messung SEA<br />
HFBEM<br />
-50<br />
0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80<br />
Abbildung 10: längsversteifte Platte, f = 8kHz<br />
Zur Zeit erfolgen weitere Berechnungen <strong>und</strong> Messungen an den Fahrzeugstrukturen, wobei bei der<br />
HFBEM-Berechnung insbesondere der Zusammenhang zwischen Plattendämpfung <strong>und</strong> Randdämpfung<br />
untersucht wird.<br />
(Dipl.-Ing. B. Knöfel)<br />
3.1.4 Messung akustischer Charakteristiken von Modellstrukturen als<br />
Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln<br />
(gefördert durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-Stiftung)<br />
Der durch Strömungen verursachte Lärm stellt eine erhebliche Belastung der Bevölkerung <strong>und</strong> der<br />
Reisenden beim Hochgeschwindigkeitsverkehr dar. Während die Strategie bisheriger Lärmminderungsverfahren<br />
weitestgehend auf eine nachträgliche Lärmsanierung am konkreten technischen Gegenstand<br />
ausgerichtet war, ist das Ziel zukünftiger Vorgehensweisen beim Lärmschutz, durch die<br />
akustische Auslegung des Verkehrsmittels ein bereits leises Verkehrsmittel entstehen zu lassen. Dies<br />
bedeutet, dass die Lärmproblematik vollständig in den Entwurf <strong>und</strong> in die Konstruktion des Verkehrsmittels<br />
integriert wird. Diese Strategie der Lärmminderung erfordert akustische Modellierungs- <strong>und</strong><br />
Simulationsverfahren, die die akustische Optimierung des virtuellen, noch nicht gegenständlich vorhandenen<br />
Verkehrs-mittels ermöglichen.<br />
Für die Realisierung dieser Vorgehensweise der Lärmbekämpfung müssen neben der Entwicklung<br />
aeroakustische Berechnungs- <strong>und</strong> Bewertungsverfahren insbesondere auch experimentelle aeroakustische<br />
Untersuchungen an Modellen von Fahrzeugstrukturen durchgeführt werden, im Spezialfall<br />
sind auch reine akustische Messungen (also ohne Strömung) an einfachen Bauteilen erforderlich.<br />
Diese Messaufgabe wurde mit finanzieller Unterstützung durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-<br />
Stiftung bearbeitet.<br />
Experimenteller Teil:<br />
• Als elektroakustische Punktschallquellen vom Typ Monopol, Dipol <strong>und</strong> Quadrupol wurden jeweils<br />
mehrere Lautsprecheranordnungen zur Realisierung eines Elementarstrahlertyps erprobt. Die akustischen<br />
Richtcharakteristiken dieser Schallquellen wurden im Großen Schallreflexionsarmen<br />
Raum, in Abhängigkeit von der Frequenz <strong>und</strong> dem Abstrahlwinkel, vermessen. Diese Punktschallquellen<br />
dienen als Modellquellen für die physikalischen Mechanismen der Strömungsschallerzeugung<br />
bei umströmten Strukturen.<br />
• Die Punktschallquellen wurden in unmittelbarer Nähe von typischen Modellstrukturen der Verkehrsmittel<br />
angebracht. Dabei wurden folgende Strukturen untersucht:<br />
- Dipol-Punktschallquelle hinter einer Platte:<br />
als Modell für den umströmten Tragflügel eines Flugzeuges <strong>und</strong> die Schallerzeugung an der<br />
Hinterkante,<br />
- Dipol-Punktschallquelle in der Ecke einer L-förmigen Platte:<br />
21
Forschung<br />
als Modell für die Schallerzeugung an der Klappenseitenkante eines Tragflügels mit ausgefahrener<br />
Landeklappe,<br />
- Dipol-Punktschallquelle im Schlitz zwischen zwei unterschiedlich breiten Platten:<br />
als Modell für die Schallerzeugung im Schlitz zwischen der ausgefahrenen Landeklappe <strong>und</strong><br />
dem Tragflügel bzw. im Schlitz zwischen dem Vorflügel <strong>und</strong> dem Tragflügel.<br />
In den beiden erstgenannten Fällen wurden die Abstände der Schallquelle zur Plattenhinterkante bzw.<br />
die Anordnungen der Schallquelle an der Klappenseitenkante variiert.<br />
• Die Messergebnisse zeigen den frequenzabhängigen Einfluss der Abmessungen der Bauteilstruktur<br />
(Tragflügel-Sehnenlänge) auf die gerichtete Schallabstrahlung der Hinterkantenströmungsschallquelle<br />
bzw. der entsprechenden Modellschallquelle an der Klappenseitenkante bzw. im<br />
Schlitz zwischen Tragflügel <strong>und</strong> ausgefahrener Landeklappe.<br />
Theoretisch-rechnerischer Teil:<br />
Zum Vergleich der Messergebnisse aus dem schallreflexionsarmen Raum mit Rechenergebnissen<br />
wurden im Rahmen dieses Projektes folgende Untersuchungen durchgeführt:<br />
• Die Richtcharakteristik der Schallabstrahlung des Hinterkantenlärms wurde mit dem hybriden numerischen<br />
Verfahren SNGR+CAA (Stochastic Noise Generation and Radiation + Computational<br />
Aeroacoustics) berechnet. Dieses Verfahren wurde im Rahmen eines DFG-Verb<strong>und</strong>projektes von<br />
der TU <strong>Dresden</strong> gemeinsam mit dem DLR Braunschweig entwickelt. Für den Vergleich mit den<br />
Messergebnissen aus dem schallreflexionsarmen Raum wurde der Richtungsfaktor der Schallabstrahlung<br />
frequenzabhängig auf einem Kreis um die Hinterkante an den Positionen von 120 virtuellen<br />
Mikrofonen berechnet. Dabei wurden die beiden Fälle der MACH-Zahl Ma = 0 <strong>und</strong> Ma = 0,11<br />
betrachtet: der erstgenannte Fall zum direkten Vergleich mit den reinen akustischen Messungen<br />
im schallreflexionsarmen Raum, siehe Abbildung 11 (Messungen erfolgte ohne Strömung), der<br />
letztgenannte Fall zur Beurteilung des Einflusses der MACH-Zahl (der bei niedrigen MACH-Zahlen<br />
gering ist).<br />
• Des Weiteren wurden die frequenzabhängigen Richtcharakteristiken der Schallabstrahlung des<br />
Hinterkantenlärms mit analytischen Rechenverfahren aufgearbeitet. Dabei ergaben sich aus den<br />
Theorien von FFOWCS WILLIAMS <strong>und</strong> HALL, von TAM <strong>und</strong> YU sowie von HOWE interessante<br />
Einblicke in den physikalischen Wirkungsmechanismus der Schallerzeugung an der Hinterkante.<br />
Mit der exzellenten, aber sehr komplizierten Theorie von HOWE konnte mit dem Computer der<br />
gesamte Frequenzbereich der Schallabstrahlung erfasst werden, <strong>und</strong> zwar von HELMHOLTZ-<br />
Zahlen kL > 1 (k Wellenzahl, L Sehnelänge des Tragflügels). Der Übergang von<br />
der Dipol-Richtcharakteristik (kompakte Quelle, kL
210<br />
120<br />
(SNGR+CAA)<br />
Forschung<br />
p/pmax<br />
90 90<br />
1<br />
60 Rechnung<br />
120<br />
0.8<br />
Messung<br />
06<br />
0.4<br />
0.2<br />
180 0<br />
150<br />
240<br />
270<br />
kL = 3 kL = 5<br />
90<br />
270<br />
Abbildung 11<br />
Richtcharakteristik des Hinterkantenlärms<br />
kL = 10 Vergleich: Messung/Rechnung<br />
G'<br />
Abbildung 12 Richtcharakteristik ( kL,<br />
Θ)<br />
des Hinterkantenlärms, berechnet mit der Theorie<br />
G'<br />
von HOWE<br />
300<br />
120 60<br />
30<br />
θ<br />
330<br />
180 0<br />
210<br />
240<br />
300<br />
30<br />
θ<br />
330<br />
Rechnung<br />
Messung<br />
max<br />
180<br />
150<br />
210<br />
240<br />
270<br />
60<br />
300<br />
30<br />
Rechnung<br />
Messung<br />
θ<br />
330<br />
0<br />
23
Forschung<br />
Die Arbeiten am Forschungsprojekt „Messung akustischer Charakteristiken von Modellstrukturen als<br />
Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln“ dienten als akustische Vor<br />
felduntersuchungen für die Entwicklung leiser Fahrzeugstrukturen beim Hochgeschwindigkeitsverkehr.<br />
Die Messungen im schallreflexionsarmen<br />
Raum <strong>und</strong> die dabei realisierte elektroakustische Modellie-<br />
rung der Strömungsschallquellen stellen eine neue aeroakustische Messmethode dar, die in dieser<br />
Form <strong>und</strong> mit diesen Ergebnissen bisher in der Fachliteratur nicht gef<strong>und</strong>en werden konnte. Der Vergleich<br />
zwischen den Messergebnissen <strong>und</strong> den Rechenergebnissen (numerische <strong>und</strong> analytische<br />
Verfahren) trug ganz wesentlich zum physikalischen Verständnis der Schallerzeugung <strong>und</strong> Schallabstrahlung<br />
von umströmten Strukturen bei.<br />
(P. Költzsch, A. Witing, M. W. Kettlitz)<br />
3.1.5 Integrierte Sensornetzwerke, Teilprojekt im SFB 639<br />
Seit Januar 2004 wird im Rahmen des DFG-Sonderforschunmgsbereiches<br />
„Textilverstärkte Verb<strong>und</strong>komponenten<br />
für funktionsintegrierende Mischbauweisen bei komplexen Leichtbau-anwendungen“<br />
SFB 639 das Teilprojekt „Integrierte Sensornetzwerke“ bearbeitet. Gemeinsam mit dem Fraunhofer<br />
Institut<br />
für Photonische Mikrosysteme werden Sensornetzwerke entworfen, die vollständig in textilverstärkte<br />
Bauteile aus Glasfaser-Polypropylen-Verb<strong>und</strong>en integrierbar sind. Derartige Bauteile werden<br />
aus mehreren textilen Lagen von Geweben oder Gestricken durch Verpressen bei Schmelztemperatur<br />
der Thermoplastkomponente gefertigt.<br />
Das Ziel der Anwendung von bauteilintegrierten Sensornetzwerken ist einerseits, die Erkennung von<br />
Ereignissen, welche plötzlich <strong>und</strong> zeitlich unbestimmt eintreten können <strong>und</strong> andererseits, die permanente<br />
Funktionsüberwachung von sicherheitsrelevanten Bauteilen. Plötzlich eintretende Ereignisse<br />
können z. B. bei Crashsituationen an Fahrzeugfrontmodulen oder durch Schlageinwirkungen an<br />
Schutzhelmen hervorgerufen werden.<br />
Das Systemkonzept umfasst auch den Entwurf von elektronischen Komponenten, wie Controller-,<br />
Sensor- <strong>und</strong> Transponderchips am Fraunhofer Institut für Photonische Mikrosysteme.<br />
Wesentliche Untersuchungen konzentrieren sich auf Systeme, die eine drahtlose Energie- <strong>und</strong> Datenübertragung<br />
voraussetzen. Derartige Systeme sind beispielsweise erforderlich, wenn in der Einsatzumgebung<br />
ein erhöhtes Explosionspotenzial besteht, das zu überwachende Bauteil vor Manipulationen<br />
geschützt werden soll oder eine Leitungsminimierung angestrebt wird (Fahrzeugbau). Für den<br />
Einsatz solcher Sensornetzwerke stehen im Fall des autonomen Betriebs nur sehr begrenzte Energieressourcen<br />
zur Verfügung. Insbesondere für den Fall, dass schnell ablaufende Vorgänge mit großer<br />
zeitlicher Auflösung erfasst werden sollen, ergeben sich außerordentlich hohe Anforderungen bezüglich<br />
des Energieverbrauches. Aufgr<strong>und</strong> der Energieknappheit bei der ebenfalls in den textilen Werkstoff<br />
integrierten Stromversorgung besteht das Interesse, eine Datenerfassung ereignisgesteuert auszulösen.<br />
Für den Fall, dass kein Gr<strong>und</strong> besteht, eine Datenaufzeichnung bzw. Auswertung vorzunehmen<br />
(Ruhezustand), sollen nur die benötigten Komponenten des Systems mit Energie versorgt werden.<br />
Im günstigsten Fall ist das System völlig ausgeschaltet. Zum schnellen Aktivieren der Elektronik<br />
aus dem stromfreien Standby-Betrieb im Moment eines kritischen Ereignisses soll ein Sensor entworfen<br />
werden, der bei Überschreiten eines bestimmten Schwellwertes der Beschleunigung so viel Energie<br />
erzeugt, dass ein Einschalten der Elektronik möglich ist. Hierfür ist die Konzeption eines piezoelektrischen<br />
Beschleunigungssensors vorgesehen. Der Entwurf des speziellen Wandlers muss sich<br />
durch hohe Temperaturbeständigkeit (Konsolidierungstemperatur während der Integration beträgt<br />
220 °C), sehr flache Bauform (geringe Festigkeitsminderung des Bauteils), robuste Ausführung (Verpressen<br />
der Glasfaser-Thermoplastmatten bei 5 bis 10 bar) <strong>und</strong> konstruktiv einstellbare Triggerbeschleunigungs-werte<br />
auszeichnen.<br />
Durch die Konsolidierungsbedingungen werden hohe Anforderungen an die Fertigungstechnologien<br />
zur zerstörungsfreien Integration von elektronischen Baugruppen, Aktoren <strong>und</strong> Sensoren gestellt. In<br />
Abbildung 13 sind die zu integrierenden<br />
Baugruppen dargestellt. Nach gelungener Integration der<br />
Systemkomponenten ist deren Resistenz gegenüber Stoßbeschleunigungen zu prüfen <strong>und</strong> die Reduktion<br />
der Bauteilfestigkeit durch die integrierte Messtechnik zu analysieren.<br />
Erste Ergebnisse zum Thema „Aufwecksensor“ wurden durch Integration von Piezokeramik-Metall-<br />
Biegeplatten in den Verb<strong>und</strong>werkstoff erzielt. Die zur Triggerung der Elektronik notwendige Energie<br />
kann je nach Beschleunigungsschwellwert durch ca. 0,5 mm dicke Sensoren mit (10...20) mm Durchmesser<br />
erzeugt werden. Die kommerziell verfügbaren Piezoelemente erfüllen<br />
allerdings nicht die<br />
Dauerfestigkeitsforderungen bei hohen Stoßbeschleunigungen. Daher laufen gegenwärtig Arbeiten<br />
zum individuellen Aufwecksensorentwurf, auch hinsichtlich der Geometrieminimierung. Durch Messungen<br />
mit mehreren, in orthogonal verstärkten Plattenstrukturen, integrierten Aufwecksensoren wur-<br />
24
Forschung<br />
den die Wellenausbreitungsgeschwindigkeiten mit (500...1000)m/s ermittelt. Daraus leitet sich die<br />
Notwendigkeit eines verteilten Sensornetzwerkes, mit Sensorabständen im Bereich von 10 cm ab,<br />
wenn reale Stöße innerhalb weniger 100 µs aufgezeichnet werden sollen. Zur Beschleunigungsmessung<br />
in Plattenstrukturen wurden erste integrierfähige Sensoren entworfen, deren Beschleunigungs-<br />
Zeit-Funktion gut mit den Messungen von extern befestigten Beschleunigungssensoren <strong>und</strong> der mit<br />
einem Laservibrometer bestimmten Oberflächenbeschleunigungen korreliert.<br />
Abbildung 13: Technologische Aufgaben bei der Integration von Messtechnik in Bauteile aus textilen<br />
Schichten<br />
Neben<br />
der Messung von Beschleunigungen in Crashsituationen ist auch die Erfassung von Deh-<br />
nungszuständen an größeren Faserverb<strong>und</strong>strukturen, wie Fahrzeugfrontmodulen von Interesse. Um<br />
den Dehnungszustand von Verstärkungsfasern innerhalb des Werkstoffes ohne eine Festigkeitsverringerung<br />
des<br />
Bauteils bestimmen zu können wird der Einsatz von Kohlenstofffasern als Messelement<br />
untersucht.<br />
Hierbei wirken die Messelemente nicht als Störung, sondern selbst als Verstärkungsfasern.<br />
Derartige Messelemente wurden entworfen <strong>und</strong> in die Glasfaser-Polypropylen-Verb<strong>und</strong>e integriert.<br />
Die Messfehler liegen derzeit im Prozent-Bereich. Schwierigkeiten bereitet noch die gestreckte<br />
Applikation der Kohlenstoff-Rovings <strong>und</strong> deren stabile Kontaktierung.<br />
Um elektronische Bauelemente in den Verb<strong>und</strong>werkstoff zu integrieren zu können, wurde deren Temperaturfestigkeit<br />
untersucht. Dafür wurden Chips der CMOS-Technologie XC06 mit Temperaturen bis<br />
300 °C über 20 min beaufschlagt <strong>und</strong> anschließend bei Raumtemperatur auf ihre Funktion getestet.<br />
Alle Funktionen von Mikrocontroller, RAM, EEPROM <strong>und</strong> Flash konnten erfolgreich geprüft werden.<br />
(Prof. G. Pfeifer, Dipl.-Ing. J. Landgraf, Dipl.-Ing. S.<br />
Folprecht, Dipl.-Ing. E. Starke)<br />
3.1.6 Ultraschallwandler für gerichtete Audioschallabstrahlung <strong>und</strong><br />
Simulationsverfahren für spezielle Anwendungen in der<br />
Elektroakustik<br />
Die seit 1999 laufenden Arbeiten zum Industriethema „Gerichtete Audioschallwiedergabe mittels<br />
Ultraschall“<br />
wurden abgeschlossen. Die Leistungsgrenzen dieses Verfahrens, die Leistungsgrenzen<br />
verschiedener<br />
Ultraschallwandlerverfahren <strong>und</strong> die aktuell vorhandenen Möglichkeiten eines<br />
praktischen<br />
Einsatzes<br />
wurden zusammenfassend<br />
dargestellt <strong>und</strong> so eine Beurteilung der Kosten-Nutzen-Relation<br />
beim<br />
Auftraggeber ermöglicht.<br />
In einer Einsatzstudie, durchgeführt von Studenten der FH Furtwangen, Fachbereich Product Engineering,<br />
wurden weitere Möglichkeiten der Anwendung untersucht. Diese Arbeiten wurden durch einen<br />
Vortrag <strong>und</strong> Konsultationen unterstützt [4].<br />
Einen weiteren Schwerpunkt bildeten Simulationsverfahren, die besonders für Anwendungen der Elektroakustik<br />
vorteilhaft sind (Netzwerktechnik)<br />
[88]. Es wurden Verfahren untersucht. die die Parametrierung<br />
komplizierter akustischer <strong>und</strong> mechanischer Bauteile als Näherungslösung durch statische<br />
Finite-Elemente-Techniken ermöglichen.<br />
25
Forschung<br />
Darüber hinaus wurden für den industriellen Auftraggeber Finite-Elemente-Rechnungen für aktuelle<br />
Mikrofonentwicklungen vorbereitet, die eine einfache Anwendung auf der Rechentechnik des AG ermöglicht.<br />
Mit der Optimierung von Magnetsystemen in elektroakustischen Geräten mit der Finite-<br />
Elemente-Technik wurde begonnen.<br />
(Prof. Dr. G. Pfeifer)<br />
3.1.7 Mikrofon mit weitgehend frequenzunabhängiger<br />
Richtcharakteristik<br />
Zur Formung spezieller Richtcharakteristiken werden in der Elektroakustik meist<br />
mehrere elementare<br />
Schallwandler räumlich zu Zeilen, Spalten oder Arrays zusammengestellt. Ohne besondere<br />
Maßnahmen<br />
sind die zu erzielenden Richtcharakteristiken<br />
frequenzabhängig.<br />
Die<br />
Richtcharakteristiken ergiben sich dabei stets aus dem Verhältnis der geometrischen Abmessun-<br />
gen der Anordnung zur Wellenlänge.<br />
Für einige Anwendungen im Bereich der Beschallungs- oder Aufnahmetechnik stört diese Frequenzabhängigkeit.<br />
Um eine Forderung nach einer weitgehend frequenzunabhängigen<br />
Richtcharakteristik<br />
zu erfüllen, müssten sich die Abmessungen der Schallwandleranordnung frequenzabhängig ändern.<br />
Eine Lösungsmöglichkeit, die Abmessungen<br />
scheinbar frequenzab-hängig zu ändern besteht darin,<br />
den benötigten Frequenzbereich in einzelne Teilbereiche zu zerlegen, eine größere Anzahl von Wandlern<br />
einzusetzen <strong>und</strong> jedem Teilfrequenzbereich nur bestimmte Wandler zuzuordnen. Die Zuordnung<br />
der Wandler zum jeweiligen Frequenz-bereich muss dabei so erfolgen, dass die Abstände der im jeweiligen<br />
Frequenzbereich aktiven Wandler zueinander zur Wellenlänge möglichst konstant bleiben.<br />
Nach diesem Prinzip arbeitet das Kardioid- Ebenen- Mikrofon KEM 970 der MICROTECH GEFELL<br />
GMBH.<br />
Dieses Mikrofon besitzt in der Horizontalebene die Richtcharakteristik einer Superniere, in der Vertikalebene<br />
dagegen die eines Richtmikrofons mit einem Öffnungswinkel von ca. 20º. Im KEM 970 wer-<br />
den<br />
acht Mikrofonkapseln mit Supernierencharakteristik eingesetzt. Je nach Frequenzbereich werden<br />
unterschiedliche<br />
Mikrofonsignale addiert <strong>und</strong> mit einer Filterbank bewertet. Nach Addition der Signale<br />
der Filterbank ergeben sich wieder ein weitgehend linearer Frequenzgang <strong>und</strong> die gewünschte Richtcharakteristik.<br />
Die ursprüngliche Entwicklung, die zum KEM 970 führte, wurde vor ca. 10 Jahren im INSTITUT FÜR<br />
RUNDFUNKTECHNIK begonnen. Neben den für Mikrofone üblichen Mikrofonkapseln <strong>und</strong> deren Vor-<br />
26
Forschung<br />
verstärker,<br />
wird im KEM 970 eine umfangreiche analoge Schaltungstechnik zur Bearbeitung der Mik-<br />
rofonsignale notwendig.<br />
In den letzten Jahren begann auch im Bereich der Mikrofontechnik eine Entwicklung hin zur digitalen<br />
Signalverarbeitung. Die ersten Mikrofone mit integriertem digitalen Signalprozessors (DSP) sind auf<br />
dem Markt. Der DSP übernimmt<br />
dabei meist die Aufgaben den Dynamikumfang der Mikrofone durch<br />
mehrere pegelmäßig kaskadierte ADC zu erhöhen (STAGETEC TRUEMATCH) <strong>und</strong> die Realisierung<br />
des digitalen Audiointerface. Für die umfangreiche Signalverarbeitung im KEM bietet sich der Einsatz<br />
eines DSP an. Am Beispiel des KEM 970 wurden am <strong>IAS</strong> alle zur Signalverarbeitung notwendigen<br />
Algorithmen für den Signalprozessor ADSP21161N von ANALOG DEVICES erstellt <strong>und</strong> erfolgreich<br />
getestet. Es zeigte sich, dass sich alle bisherigen analogen Signalverarbeitungsstufen des KEM durch<br />
digitale Signalverarbeitung vorteilhaft ersetzen lassen. Einen deutlichen Qualitätsgewinn brachte die<br />
digitale Signalverarbeitung im Bezug auf den zu erreichenden Signal- Rauschabstand.<br />
Die Programmierung des ADSP21161N erfolgte in der Sprache ANSI-C. Dabei musste festgestellt<br />
werden, dass diese Programmiersprache den DSP nur schlecht unterstützt, so dass die programmierten<br />
Algorithmen nur bis zu einer Abtastfrequenz von 48 KHz zuverlässig funktionierten.<br />
Für höhere<br />
Abtastfrequenzen <strong>und</strong> umfangreichere Filterstrukturen ist deshalb die Programmierung zukünftig in<br />
Assemblersprache notwendig.<br />
(Dipl.-Ing. D. Richter)<br />
3.1.8 Bestimmung von Kenngrößen eines Telefonhörers<br />
Für den Hersteller von Kommunikationstechnik PRAGMA, Zittau, wurden Messungen<br />
zur Bestimmung<br />
von Kenngrößen eines Telefonhörers durchgeführt. Dabei war die Ermittlung von<br />
Übertragungsmaß<br />
<strong>und</strong><br />
Spektrum einer Hörkapsel für vorgegebene, spezielle Ansteuerbedingungen von besonderem<br />
Interesse.<br />
Die Messungen erfolgten mit Hilfe eines künstlichen Ohres nach IEC 318 (Artificial Ear Type 4153,<br />
Brüel & Kjaer).<br />
Vorab war die Gestaltung der mechanischen Ankopplung der Hörkapsel an das künstliche Ohr zu<br />
klären. Das Ziel dabei war, die Relevanz der Messergebnisse nachzuweisen <strong>und</strong> eine ausreichende<br />
Reproduzierbarkeit<br />
zu sichern. Im Ergebnis gelang es, charakteristische Daten für die Hörkapsel zu<br />
erhalten, die den Messvorgaben ausreichend gerecht wurden.<br />
(Dr. G. Fuder)<br />
27
Forschung<br />
3.2 AG „Systemtheorie <strong>und</strong> Sprachkommunikation“<br />
3.2.1 Vorbemerkung<br />
Die Arbeitsgruppe betreibt weiterhin Signal- <strong>und</strong> Systemtheorie mit besonderer Betonung der Anwendung<br />
in der Sprachtechnologie. Die Arbeiten gruppieren sich um die beiden, nun schon über eine Anzahl<br />
von Jahren gepflegten experimentellen Systeme UASR <strong>und</strong> DRESS.<br />
Das System UASR (unified approach for speech synthesis and recognition), das zur experimentellen<br />
Untersetzung des Analyse-durch-Synthese-Prinzips konzipiert wurde, dient gegenwärtig hauptsächlich<br />
als Plattform für Erkennerexperimente. Die Technologie ist inzwischen so weit ausgereift, dass neben<br />
der Abspaltung von Lösungen für die Spracherkennung (z. B. Speech-Applet für Projekte der Webbasierten<br />
Lehre) sogar erfolgreiche Anwendungen auf nichtsprachliche Signale möglich wurden (Maschinendiagnose,<br />
medizinische Diagnose, Musiksequenzen), zu denen u. a. ein DFG-Projekt in Kooperation<br />
mit dem Fraunhofer Institut für zerstörungsfreie Prüfverfahren im Berichtsjahr begonnen<br />
werden konnte.<br />
Das System DRESS (Dresdner Sprachsynthese) wird ebenfalls als Forschungssystem weitergeführt<br />
<strong>und</strong> diente im Berichtszeitraum hauptsächlich zur vertieften Untersuchung von Prosodiemodellen. Für<br />
die Finanzierung der Forschungsarbeiten bildet die praktische Anwendung von DRESS in einer Embedded-Variante<br />
die wichtigste Quelle. Diese Arbeiten wurden im Rahmen der Virtuel Research and<br />
Development Group (VRDG) mit der von Prof. Höge geleiteten Siemens-Arbeitsgruppe weitergeführt.<br />
Beide Einrichtungen waren 2004 Gründungsmitglieder des European Center of Excellence on Speech<br />
Synthesis (ECESS); vgl. www.ecess.org.<br />
Die folgende Darstellung bietet eine Übersicht vornehmlich zu den Arbeiten an den beiden genannten<br />
Komplexen. Von den recht zahlreichen kleineren Aktivitäten wird danach eine Auswahl beschrieben.<br />
3.2.2 UASR (Unified Approach for Speech Synthesis and Recognition)<br />
Das Forschungssystem UASR beschäftigt sich mit der „Integration von Spracherkennung <strong>und</strong> Sprachsynthese<br />
unter Verwendung gemeinsamer Datenbasen“. Über dieses Projekt haben wir bereits in den<br />
Jahren 2002 <strong>und</strong> 2003 berichtet. Für einen Überblick über die Ziele <strong>und</strong> die Systemarchitektur wird auf<br />
die entsprechenden Jahresberichte sowie auf [1] verwiesen. Die Anwendung <strong>und</strong> der Ausbau des<br />
Systems wurden im Rahmen von zwei DFG-Projekten fortgeführt. Im Berichtsjahr entstand eine ausführliche<br />
Dokumentation auf HTML-Basis (Abbildung 14).<br />
In diese Dokumentation wurden die Beschreibungen der Module des Systems, zugehörige Konferenzbeiträge<br />
<strong>und</strong> technische Beschreibungen, sowie anwendungsspezifische Dokumente aufgenommen.<br />
Algorithmische Weiterentwicklungen fanden vor allem bei den Methoden zur Verarbeitung von FSMs<br />
(finite state machines) statt. Auf diese Arbeiten wird im Abschnitt b) eingegangen. Weiterhin wurde die<br />
Integration von Verfahren zur Sprechernormalisierung (VTN) fortgeführt <strong>und</strong> die Ergebnisse auf der<br />
ICASSP 2004 vorgestellt [2].<br />
Im Jahresbericht 2003 hatten wir über einen Sprachdienst mit verteilter Architektur berichtet, der im<br />
Rahmen des Projektes eL-IT eingesetzt wurde. Wir haben den Spracherkenner weiterentwickelt <strong>und</strong><br />
um eine Stimmaktivierung ergänzt (Abschnitt c). Durch die Client/Server-Architektur eignet sich das<br />
System besonders zur Integration von Sprachtechnologie in bestehende Anwendungen. In einer <strong>Diplom</strong>arbeit<br />
wurde die Sprachsteuerung eines Computerspiels in Hinblick auf die ergonomischen Qualitäten<br />
untersucht ([5], siehe Abschnitt d).<br />
a) LM-Synergien<br />
Im Jahresbericht 2003 haben wir gezeigt, wie der Einsatz <strong>und</strong> die Verwendung eines Sprachmodells<br />
(LM = Language Model) zur Auswahl von Aussprachevarianten in der Sprachsynthese zu einer höheren<br />
Akzeptanz im Bereich der Natürlichkeit (54% der Testbeispiele) <strong>und</strong> Spontanspachlichkeit (64%<br />
der Testbeispiele) führt.<br />
Weitere Untersuchungen haben aber auch ergeben, dass vor allem Wortübergänge falsch modelliert<br />
werden. Bisher wurde die Aussprachevariante nur anhand der Dauer ausgewählt. Es wird kein Wissen<br />
darüber verwendet, wie gut zwei ausgewählte Varianten zueinander passen oder nicht. Auch kann<br />
28
Forschung<br />
nicht jede Variante an jeder Stelle einer Äußerung stehen: z. B. kurze Aussprachevarianten sollten<br />
nicht als erste Silbe eines Satzes stehen oder zwischen zwei wichtigen Inhaltswörtern.<br />
Abbildung 14: Startseite der Dokumentation zu UASR.<br />
Um die Natürlichkeit der synthetisierten Aussprachevarianten weiter zu erhöhen <strong>und</strong> Wortübergänge<br />
besser modellieren zu können, wurde ein Varianten-Folgemodell trainiert. Der Einsatz dieses Folgenmodells<br />
zur Auswahl der Aussprachevariante erfolgte mittels des folgenden Algorithmus:<br />
(1) Berechnung der Sprachmodell-Wahrscheinlichkeit.<br />
(2) Berechnung der initialen relativen Wortdauern mittels der aus dem Sprachmodell bestimmten<br />
Wortfolgenwahrscheinlichkeit.<br />
(3) Rücksetzen der Akzentpunkte: Alle Wortdauern von Wörtern mit akzentuierten Silben werden<br />
auf 1 gesetzt.<br />
(4) Glättung der relativen Wortdauern.<br />
(5) Berechnung der Wortzieldauern aus den relativen Wortdauern. Eine relative Dauer von 1 entspricht<br />
dabei einer kanonischen Realisierung.<br />
(6) Erstellen eines Markov-Graphen für jede zu synthetisierende Äußerung. Jeder Knoten des<br />
Graphen steht dabei für eine Variante <strong>und</strong> ist mit einer eindimensionalen Gaußdichtefunktion<br />
gekoppelt, welche die Dauer dieser Variante beschreibt. Die Kanten des Graphen tragen Übergangsgewichte,<br />
welche mittels Varainten-Folgemodells bestimmt sind.<br />
(7) Suche des besten Pfades durch den Graphen <strong>und</strong> Auswahl der darauf liegenden Varianten.<br />
29
Forschung<br />
Die Auswahl der Aussprachevarianten mittels Markov-Graphen kann wie folgt dargestellt werden:<br />
Wenn { w1 o Lo<br />
w2}<br />
eine zu synthetisierende Wortfolge darstellt <strong>und</strong> A(<br />
wi<br />
) die Menge der Varianten<br />
des Wortes w , dann kann das Aussprachemodell G dieser Wortfolge wie folgt als stochastischer<br />
i<br />
Markov-Graph (SMG) ausgedrückt werden:<br />
{ { } } ) ( ) ( V E<br />
V , E,<br />
N , ν ,<br />
G =<br />
π<br />
Dabei entspricht V der Knoten- <strong>und</strong> E der Kantenmenge. Die Menge { N } der eindimensionalen<br />
Gaußverteilungen wird durch ein Realignment abgeleitet <strong>und</strong> beschreibt die Dauer der Aussprachevarianten.<br />
( V )<br />
Die Zuordnung : V → { N}<br />
E → ℜ<br />
ν weist jedem Knoten eine Gaußfunktion zu, wobei<br />
jeder Kante ein Übergangsgewicht zuweist. Die Knoten- <strong>und</strong> Kantenmengen werde wie folgt gebildet:<br />
U<br />
wi<br />
V = A(<br />
wi<br />
) <strong>und</strong> E = U A(<br />
wi<br />
) × A(<br />
wi−1<br />
)<br />
wi<br />
Jede Kante steht für einen Übergang von der Variante Α s (gekennzeichnet durch den Anfangsknoten<br />
vs ) zur Variante e (gekennzeichnet durch den Endknoten ). In Abbildung 15 ist ein Beispiel für<br />
ein Aussprache-SMG der Äußerung {morgens ○ zwischen ○ acht ○ <strong>und</strong> ○ neun} dargestellt.<br />
Α ve<br />
Abbildung 15: Stochastischer Markov-Graph (SMG) der Aussprachevarianten der Äußerung {morgens<br />
○ zwischen ○ acht ○ <strong>und</strong> ○ neun}. Knoten stellen Aussprachevarianten dar <strong>und</strong> Kanten enthalten<br />
die aus dem Aussprachesprachmodell ermittelten Gewichte. Der fett gezeichnete Pfad kennzeichnet<br />
den ausgewählten Pfad unter Beachtung des Varianten-Folgemodells. Dieses Beispiel zeigt die korrekte<br />
Berücksichtigung von Wortübergängen, z. B. Auslassung des /t/ <strong>und</strong> Angleichung des /s/ zwischen<br />
den ersten beiden Wörtern. Zum Vergleich zeigt der gestrichelte Pfad die Variantenauswahl nur<br />
unter Verwendung des kanonischen Sprachmodells <strong>und</strong> der Zieldauer.<br />
Wenn der Markov-Graph G erster Ordnung ist, dann ist 2 die maximale n-Gramm Ordnung, welche<br />
für das Übergangsgewicht verwendet wird. So werden die Kanten mittels Interpolation von Zero-<br />
Grammen, Uni-Grammen <strong>und</strong> Bi-Grammen wie folgt gewichtet:<br />
30<br />
( P(<br />
Α | Α ) ) = ln(<br />
f ⋅ P(<br />
Α | Α ) + f ⋅ P(<br />
Α ) + f ⋅ )<br />
w vs<br />
, ve<br />
) ln e s<br />
2 e s 1 e<br />
( = P ,<br />
0<br />
0<br />
π<br />
( E )<br />
:
Forschung<br />
wobei , <strong>und</strong> die Gewichte der einzelnen n-Gramme <strong>und</strong> P die Zero-Gramm- Wahr-<br />
f 0 f1 f 2<br />
0<br />
scheinlichkeit kennzeichnen.<br />
Die Verwendung von SMG’s höherer Ordnung ist prinzipiell möglich, erfordert jedoch einen enormen<br />
Datenaufwand, um eine gesicherte statistische Aussage über mehrere aufeinander folgende Aussprachevarianten<br />
treffen zu können.<br />
Wenn die absolute Länge d i = d(<br />
wi<br />
) des Wortes wi<br />
einer zu synthetisierenden Äußerung gegeben<br />
ist, kann die optimale Folge der Aussprachevarianten als<br />
[ w(<br />
Α | Α ) + γ ln p(<br />
d | N ]<br />
arg max ∑ i i−1<br />
A∈G<br />
Αi∈A<br />
*<br />
A =<br />
)<br />
bestimmt werden, wobei w( Ai<br />
| Ai−1<br />
) das Kantengewicht des Überganges Ai− 1 o Ai<br />
<strong>und</strong> p(<br />
d i | N i )<br />
die Wahrscheinlichkeitsdichte der gewünschten Wortlänge d (aus der Dauerstatistik der Aussprache-<br />
variante Α ) darstellt. Mit dem Skalierungsfaktor γ kann eingestellt werden, ob die gewünschte Wort-<br />
i<br />
länge oder die wahrscheinlichste Wortfolge stärker beachtet wird.<br />
Die Syntheseexperimente haben gezeigt, dass gegenüber der reinen Variantenauswahl mittel<br />
s„normalen“ Sprachmodell (vgl. Jahresbericht 2003) die zusätzliche Verwendung eines Aussprache-<br />
Sprachmodells eine bedeutende Steigerung der Spontanssprachlichkeit zur Folge hat, jedoch nur<br />
leichte Verbesserungen im Bereich der Natürlichkeit (vgl. Tabelle 1) bringt.<br />
Tabelle 1: Ergebnisse des Hörtests mittels Paarvergleich<br />
„Reine“ Varaintenauswahl<br />
i<br />
i<br />
i<br />
Variantenfolgemodell<br />
Verständlichkeit 15,8 % 22,3%<br />
Natürlichkeit 53,3 % 54,4 %<br />
Spontansprachlichkeit 64,6 % 73,7 %<br />
MOS (kanonisch: 3,21) 2,85 2,93<br />
Allerdings zeigen die Ergebnisse auch, dass die meisten Hörtestteilnehmer die kanonische Synthese<br />
als verständlicher bewertet haben. Beachtet man jedoch, dass jede über-artikulierte Ausspracheform<br />
in der Regel verständlicher ist als eine reduzierte Variante (auch bei natürlicher Sprache), so ist dieses<br />
Ergebnis nicht überraschend.<br />
Die Verwendung von Aussprachesprachmodellen erhöht nicht nur die Qualität der Sprachsynthese,<br />
sondern kann auch im Bereich der Spracherkennung Verbesserungen hervorrufen. Die Verwendung<br />
von Aussprachewörterbüchern in der Erkennung wird schon seit langem untersucht. Jedoch wurden<br />
nur Verbesserungen der Erkennungsrate erreicht, wenn durchschnittlich nur 1,1 bis 1,5 Varianten pro<br />
Wort verwendet wurden. Die Verwendung von mehr Varianten erhöht die Verwechslungswahrscheinlichkeit<br />
in der Art, dass die Erkennungsraten sinken.<br />
Das Wörterbuch für die Syntheseexperimente enthielt durchschnittlich 2,8 Varianten pro Wort, in früheren<br />
Experimenten haben wir sogar mit 3,7 Varianten pro Wort gearbeitet. Tabelle 2 zeigt, wie stark<br />
die Erkennungsraten sinken, wenn man ein kanonisches Wörterbuch durch ein solches Variantenwörterbuch<br />
ersetzt. Verwendet man nun statt des kanonischen Sprachmodells das Variantensprachmodell,<br />
so erhöht sich die Erkennungsrate wieder. Man erreicht aber noch nicht die Ergebnisse wie mit<br />
rein kanonischem Wörterbuch <strong>und</strong> Sprachmodell. Die Verwendung von Aussprachesprachmodellen in<br />
der Erkennung könnte aber ein Ausweg sein, wenn man auf die Verwendung von Variantenwörterbüchern<br />
angewiesen ist.<br />
Tabelle 2: Erkennungsergebnisse<br />
Setup Korrektheit<br />
Kanonisches Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 76,6 %<br />
Varianten-Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 61,8 %<br />
Varianten-Wörterbuch + Varianten Bi-Gramm Sprachmodell 68,8 %<br />
31
Forschung<br />
b) Methoden zur Verarbeitung von Finite State Machines<br />
Die auf STL basierende FSM-Bibliothek (C++) wurde in C umgeschrieben (neue dLabPro-Komponente)<br />
<strong>und</strong> erweitert, um mit dem Log-Semiring <strong>und</strong> Probability-Semiring arbeiten zu können.<br />
Weiterhin erfolgte eine Implementierung des „FSM Katz’ Back-Off“-Sprachmodells, die hier kurz erläutert<br />
werden soll. Ausgangspunkt ist, dass FSM-Sprachmodelle zwei Anforderungen erfüllen müssen:<br />
• Gewichtschätzungskorrektheit: Die Haupteigenschaft gewichteter FSM für Spracherkennungsaufgaben<br />
ist ihre Fähigkeit, Red<strong>und</strong>anz ohne Informationsverlust zu verringern. Damit diese Eigenschaft<br />
völlig ausgenutzt werden kann, sollten die Gewichte zweckmäßig berechnet werden, um<br />
sinnvolle Aussagen <strong>und</strong> Vergleiche zu ermöglichen. Diese Aufgabe fordert ein geeignetes<br />
Sprachmodell, das die korrekte Schätzung der Gewichte gewährleistet.<br />
• Pfadkontinuität: Die einfachste Art eines stochastischen Sprachmodels ist ein n-Gram, ein Modell,<br />
das eine natürliche Verkörperung eines FSMs erlaubt. Wenn ein Worthypothesen-FSM mit einem<br />
Sprachmodell-FSM komponiert wird, ergibt sich ein neues FSM, welches nur diejenigen Sätze aus<br />
der Worthypothese beinhaltet, die vom Sprachmodell akzeptiert wurden. Diese Prozedur hat den<br />
Hauptnachteil, dass keine korrekten Ergebnisse erzeugt werden, falls die Worthypothese die<br />
Wortsequenz w1-wn enthält, aber im Sprachmodell das n-gram wn| w1-wn-1 nicht existiert.<br />
Katz schlug eine Methode basierend auf der Arbeit von Good-Touring zur Schätzung von n-Gram-<br />
Wahrscheinlichkeiten vor, wenn diese wegen Mangels an Information nicht zur Verfügung stehen.<br />
Deshalb müssen nicht trainierte n-Grams wn| w1-wn-1 geschätzt werden, ohne dass die Suche durch<br />
das FSM-Sprachmodell unterbrochen wird.<br />
Die theoretische <strong>und</strong> praktische Implementierung des Katz-Sprachmodells in der Form eines FSMs<br />
wurde in einem Forschungsbericht ausführlich erklärt.<br />
Das Sprachmodell wurde anhand mehrerer Word-Lattice-Hypothesen geprüft, <strong>und</strong> erwartungsgemäß<br />
erhält das höchste Score diejenige Wortfolge, der die höchste Wahrscheinlichkeit im Sprachmodell<br />
zugewiesen wurde, was letztendlich vom Trainingskorpus abhängt. Die Abbildungen 16 bis 18 schildern<br />
ein einfaches Beispiel für die Worthypothese H1, “D A B”, ein FSM-Katz-Sprachmodell für den<br />
Satz „A B C D“ <strong>und</strong> den Suchpfad (Strichlinie). Die Wahrscheinlichkeit des Satzes “D A B.” ist das<br />
Produkt aller Kantengewichte.<br />
32<br />
s<br />
P(“D A B.”) = αs * PGT(D) * αD * PGT (A) * PGT (B|A) * αAB * αB * PGT (.)<br />
A<br />
A/PGT(A)<br />
φ/αs<br />
NH<br />
0<br />
D / 1 A / 1 B / 1 . / 1<br />
1 2 3<br />
4<br />
Abbildung 16: Worthypothese H1.<br />
C D<br />
sAB ABC BCD<br />
B C<br />
φ<br />
sA AB BC CD<br />
φ<br />
B/PGT(B|A)<br />
φ/αAB<br />
C<br />
φ<br />
D<br />
φ<br />
A B C<br />
φ<br />
φ/αB<br />
B<br />
φ<br />
D/PGT(D)<br />
C<br />
φ<br />
φ/αD<br />
D<br />
D<br />
.<br />
.<br />
. /PGT(.)<br />
Abbildung 17 Die Strichlinie zeigt Back-Off-Komposition zwischen<br />
H1 <strong>und</strong> dem grau gefärbten Sprachmodell.<br />
.<br />
END
S<br />
Forschung<br />
D/αs ε/PGT(D) A/αD ε/PGT(A) B/PGT(B|A) ./αAB ε/αB ε /PGT(.)<br />
NH<br />
D NH<br />
A<br />
AB B NH<br />
END<br />
Abbildung 18 Resultierendes FSM nach der Back-Off-Komposition.<br />
c) Stimmaktivierung eines Spracherkenners<br />
Die Aktivierung eines Spracherkenners stellt einen kritischen Faktor für den praktischen Einsatz von<br />
Sprachtechnologien dar. Aktuelle Systeme erfordern meist eine manuelle Bedienung per Tastendruck<br />
(„push-to-talk“) zum Freischalten des Erkenners. Für viele Anwendungen stellt die Aktivierung per<br />
Sprache eine sinnvolle Alternative dar. Bei der Stimmaktivierung kommen als Schlüsselwörter oft exotische<br />
Ansprechwörter zum Einsatz, welche in normaler Unterhaltungssprache sehr selten auftreten.<br />
Dies soll irrtümliche Aktivierungen des Erkenners vermeiden. Unter dem Blickwinkel der Benutzerakzeptanz<br />
sind solche exotischen Schlüsselwörter jedoch kritisch zu betrachten. In aktuellen Stimmaktivierungssystemen<br />
finden prosodische Faktoren wie die Stimmmelodie, die Intensität oder die Wort-<br />
bzw. Silbendauer kaum Beachtung. Man kann jedoch experimentell zeigen, dass Benutzer beim Ansprechen<br />
eines Sprachdialogsystems das entsprechende Schlüsselwort besonders betonen (siehe<br />
Abbildung 19). Daher haben wir ein Verfahren zur Integration prosodischer Merkmale in die Schlüsselworterkennung<br />
zur Stimmaktivierung entwickelt [5]. Die primäre Zielsetzung bestand in einer Verbesserung<br />
der Robustheit der Stimmaktivierung bei gleichzeitigem Verzicht auf exotische Schlüsselwörter.<br />
Es wurde experimentell untersucht, inwiefern prosodische Merkmale dazu beitragen können,<br />
das Auftreten eines bestimmten Schlüsselworts beim Ansprechen des Erkenners vom Auftreten desselben<br />
Wortes innerhalb normaler Unterhaltungssprache zu unterscheiden.<br />
normalized F 0<br />
k O m p j u: t E 6 label<br />
Abbildung 19: F0 Konturen des Schlüsselwortes „Computer“ aus Kommandophrasen (command) <strong>und</strong><br />
normaler Sprache (non-command).<br />
Zur Modellierung der prosodischen Merkmale des Ansprechwortes wurde ein auf den Gr<strong>und</strong>frequenz-<br />
<strong>und</strong> Intensitätsverlauf trainiertes Hidden-Markov-Modell in einen Kommandoerkenner integriert (siehe<br />
Abbildung 20). Die prosodische Erkennungsleistung des erstellten Modells wurde mit den Erkennungsresultaten<br />
von menschlichen Versuchspersonen in einem Hörtest verglichen. Für eine identische<br />
Aufgabenstellung erreichte das trainierte Modell mit einer Erkennungsrate von 74,2% bei einer<br />
Fehlalarmrate (irrtümliche Aktivierung) von 25,5% nur geringfügig schlechtere Ergebnisse als die<br />
menschlichen Versuchspersonen. Diese erzielten eine mittlere Erkennungsrate von 81% bei einer<br />
Fehlalarmrate von 29%. Durch die Integration des prosodischen Modells in die Kommandoerkennung<br />
erfolgte eine zusätzliche Verifikation der Schlüsselworthypothesen des phonetischen Erkenners. Als<br />
Resultat dieser Überprüfung konnte die Equal Error Rate (gleiche Anzahl von Fehlaktivierungen <strong>und</strong><br />
Fehlrückweisungen) von 13,1% auf 6,9% verringert werden. Die Kommandoerkennungsrate wurde im<br />
Experiment gleichzeitig von 85,1% auf 91,4% gesteigert. Durch eine alternative Rückweisungsstrategie,<br />
basierend auf einer Abstandsklassifikation der Konfidenzmaße, konnte die Erkennungsrate weiter<br />
auf 93,6% erhöht <strong>und</strong> die Anzahl der Fehlaktivierungen auf 2,2% reduziert werden.<br />
time<br />
33
Forschung<br />
Abbildung 20: Blockschaltbild des Spracherkenners, bestehend aus drei wesentlichen Bestandteilen:<br />
Kompilation des Erkennungsnetzwerks, Spracherkenner <strong>und</strong> Referenzerkenner (freie Phonemerkennung)<br />
zur Berechnung von Konfidenzwerten <strong>und</strong> zur Rückweisung. Die grau hinterlegten Bereiche<br />
markieren die prosodische Schlüsselwortverifikation<br />
d) Prosodie-Komponente von UASR<br />
Von den Komponenten von UASR ist bisher die Implementierung der prosodischen „Klammer“, die<br />
sich um den Analyse- <strong>und</strong> Synthesezweig legt, am wenigsten fortgeschritten. Die besonders durch die<br />
Entwicklung von DRESS vorliegenden Erfahrungen sollen im Rahmen des Promotionsvorhabens von<br />
Herrn Oba hier einfließen. Im Berichtsjahr konzentrierte er sich besonders auf den Zusammenhang<br />
von Dialekt <strong>und</strong> Intonation <strong>und</strong> führte dazu vergleichende Untersuchungen anhand des Verbmobil-<br />
Korpus durch. Die vorläufigen Ergebnisse wurden zum Prager Workshop veröffentlicht [6].<br />
e) UASR-Resynthese-Experimente<br />
Die UASR-Architektur ermöglicht die Resynthese von einem erkannten Sprachsignal, dessen Fehler<br />
akustisch erkannt werden können, was ein zusätzliches Werkzeug zur Fehleridentifizierung darstellt.<br />
Anhand dieses Konzepts wurden die ersten Blöcke unseres experimentellen Systems untersucht.<br />
34
Forschung<br />
Abbildung 21 stellt den Signalfluss vom Sprachsignal zum Laut sowie das entsprechende synthetisierte<br />
akustische Signal in jedem Zwischenschritt dar.<br />
Abbildung 21: Signalfluss Resynthese.<br />
Das Experiment bewies, dass kein wahrnehmbarer Informationsverlust nach der Merkmalextraktion<br />
<strong>und</strong> Merkmalraumreduktion (Cepstrum analysis and PCA) stattfand.<br />
Die Verständlichkeit des Sprachsignals nach der Vektorquantizierung verschlechtert sich drastisch,<br />
denn die trainierten Phonemmodelle sind nicht akkurat genug. Ein zusätzliches Problem tritt auf wenn<br />
die erkannten Phoneme synthetisiert werden, da die Pitch-Information (Tonhöhe) an die neuen Merkmale<br />
angepasst werden soll.<br />
Ein weiteres Problem ist die Tatsache, dass die Pitch-Information nach der Merkmalextraktion nicht<br />
mehr zur Verfügung steht. Deshalb muss sie künstlich hinzugefügt werden, was die Fehleridentifizierung<br />
in gewissem Maße in einen subjektiven Prozess verwandelt.<br />
Zum Thema „Fehleranalyse von Phonemhypothesengraphen“ wurde eine Studienarbeit angefertigt<br />
[7].<br />
f) Anwendung auf nichtsprachliche Signale I: Qualitätsbewertung technischer Prozesse<br />
Das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer<br />
Prozesse“ wurde im Dezember 2003 bewilligt. Dieses Projekt wird gemeinsam mit dem Fraunhofer<br />
Institut für Zerstörungsfreie Prüfverfahren (IZFP-D) <strong>Dresden</strong> bearbeitet. Dabei werden von technischen<br />
Prozessen stammende Signale klassifiziert.<br />
Klassifikationsverfahren<br />
Das entwickelte Klassifikationsverfahren beruht auf Algorithmen der Folgenklassifikation sowie Methoden<br />
zur Strukturaufdeckung, also zum automatischen Lernen von endlichen Zustandsautomaten.<br />
Abbildung 22 zeigt ein Konzept für das Verfahren. Zur Merkmalextraktion wurde die Spektraltransformation<br />
verwendet. Die Merkmalkompression erfolgte durch Zusammenfassen von Vektorkomponenten<br />
sowie durch lineare Transformationen (Karhunen-Loeve-Transformation). Das akustische Modell<br />
wurde durch ein SMG-Modell (Stochastischer Markov-Graph 1. Ordnung) realisiert.<br />
35
Forschung<br />
Abbildung 22: Konzept für ein Folgenklassifikationsverfahren für technische Signale mit den folgenden<br />
wesentlichen Bausteinen: Merkmalextraktion, Klassifikation durch ein akustisches Modell, Selbstkontrolle<br />
der Klassifikation durch Auswertung eines Konfidenzmaßes, bei Rückweisung manuelle<br />
Klassifikation <strong>und</strong> Nachtraining. Der Arbeitspunkt der Selbstkontrolle wird als angemessener Kompromiss<br />
zwischen Fehlrückweisungs- <strong>und</strong> Fehlakzeptanzrate (FAR/FRR) gewählt.<br />
Methoden für das automatische Anlernen<br />
Ein weiterer Schwerpunkt des Projekts liegt auf der Erforschung <strong>und</strong> Entwicklung von datengetriebenen<br />
Trainingsmethoden. Alle Wissensquellen des Klassifikators sollen automatisch durch Anlernen mit<br />
einer (von Hand) klassifizierten, möglichst kleinen Trainingsstichprobe aufgebaut werden.<br />
Für den Klassifikator wurden folgende Wissensquellen trainiert:<br />
• die Merkmalstatistik <strong>und</strong> daraus abgeleitete Eigenvektormatrix für die Merkmaltransformation,<br />
• die Struktur der endlichen Zustandsautomaten des akustischen Modells,<br />
• die Emissionsverteilungsdichten des akustischen Modells sowie<br />
• ggf. Rückweisungsschwellwerte.<br />
36
Forschung<br />
Der Schwerpunkt für die Erforschung der Trainingsmethoden lag auf der automatischen Strukturaufdeckung,<br />
da hier das größte zusätzliche Potential im Vergleich mit herkömmlichen Klassifikationsmethoden<br />
erwartet wurde.<br />
Abbildung 23 zeigt ein erstes Konzept für ein mögliches Trainingsverfahren, welches an Prinzipien der<br />
Klassifikation von Sprachsignalen angelehnt ist.<br />
Lernstichprobe<br />
Signal Klassen<br />
Merkmalextraktion<br />
Merkmalvektoren<br />
Merkmalkompression<br />
Merkmalvektoren<br />
Viterbi<br />
Training<br />
Modellversäuberung<br />
Merkmalstatistik<br />
Modellinitialisierung<br />
Weltmodell<br />
Akustisches<br />
akustisches<br />
Modell<br />
Klassenmodelle<br />
Gaußmodelle<br />
teilen<br />
Klassenmodelle<br />
Klassenmodelle<br />
Klassenmodelle<br />
(klassenabhänige)<br />
Statistik<br />
Klassenmodelle<br />
Reklassifikation<br />
Abbildung 23: Konzept für ein vollautomatisches, datengetriebenes Training für die Klassifikation<br />
technischer akustischer Signale<br />
Experimente<br />
Bereits im Jahresbericht 2003 wurden die ersten durchgeführten Fallbeispiele zur Eignung der Folgenklassifikation<br />
für technische Signale beschrieben.<br />
In diesem Jahr lag der Schwerpunkt der Anwendungen auf mikrofluidischen Bauelementen. Die Prüfaufgaben<br />
dabei bestanden neben der Unterscheidung zwischen neuwertigen <strong>und</strong> gebrauchten Baulelementen<br />
in der Durchführung einer Lebensdaueranalyse mit dem Ziel, einen bevorstehenden Ausfall<br />
rechtzeitig zu erkennen. Die Untersuchungen wurden in Form eines Dauerversuches durchgeführt, bei<br />
dem Ventile zyklisch geöffnet <strong>und</strong> geschlossen wurden. Die Signale während des Schließvorganges<br />
wurden aufgezeichnet <strong>und</strong> mittels UASR klassifiziert. Zu diesem Zwecke wurden verschiedene akustische<br />
Modelle entsprechend des Lebensalters der Ventile angelernt. Das Anlernen erfolgte über n<br />
Ventile, wobei es galt, das (n+1)-te Ventil mittels der trainierten Modelle zu klassifizieren bzw. dessen<br />
Zustand möglichst genau zu analysieren.<br />
Zum Training jedes Klassenmodells wurden jeweils 1000 Daten verwendet. Verschiedene Modelle<br />
wurden gebildet:<br />
− Neu (Modell aus neuwertigen Ventilen)<br />
− Mittel (Modell aus Ventilen mittlerer Lebenszeit)<br />
− Alt (Modell aus alten Ventilen)<br />
37
Forschung<br />
Im folgenden Beispiel (Abbildung 24) wurden die Trainingsmodelle aus Daten der Ventile 2 <strong>und</strong> 3 gebildet,<br />
klassifiziert wurde Ventil 5. Dargestellt sind die Modelle Alt <strong>und</strong> Neu sowie die Differenz aus Alt<br />
<strong>und</strong> Neu, das die beste Tendenzanzeige lieferte.<br />
Abbildung 24: Beispiel – Akustische Lebensdaueranalyse von Ventilen.<br />
g) Erkennung nichtsprachlicher Objekte II: Nichtinvasive Blutdruckmessung am aktiven Menschen<br />
Ein besonderes Problem bei der messtechnischen Erfassung von Blutdruckwerten stellen Messungen<br />
am aktiven Probanden dar. Als Messverfahren sollte die akustische Auswertung der sogenannten<br />
Korotkow-Geräusche verwendet werden, worauf üblicherweise die „klassische“ Blutdruckmessung in<br />
der Alltagsmedizin beruht. Durch eine geeignete Messanordnung <strong>und</strong> nachfolgende Signalverarbeitung<br />
bzw. –auswertung soll dieses Verfahren auch für die Blutdruckmessung am aktiven Menschen,<br />
d. h. unter gestörten Bedingungen, eingesetzt werden.<br />
Auf Gr<strong>und</strong> des Charakters der Störkomponenten scheinen einfachere Detektionsalgorithmen für die<br />
beiden Messzeitpunkte Anfang <strong>und</strong> Ende des Korotkow-Geräuschs wenig aussichtsreich. Aus diesem<br />
Gr<strong>und</strong> wurde auf einen Mustererkennungsansatz orientiert, wie er z. B. im Bereich der automatischen<br />
Spracherkennung für die Detektion von bestimmten Schlüsselwörtern in Wortketten verwendet wird.<br />
Als Merkmale kommen spektrale Koeffizienten zum Einsatz (256-Punkte-Fast-Fouriertransformation,<br />
Fortsetzrate: 128 Abtastwerte), die vom amplitudennormierten Messsignal berechnet werden. In einer<br />
Merkmalauswahlstufe wird die Anzahl der Koeffizienten auf 9 logarithmierte reduziert. Der Merkmalsatz<br />
wurde durch Delta- <strong>und</strong> Delta-Delta-Koeffizienten <strong>und</strong> die mittlere Signalenergie komplettiert.<br />
Der Vergleichsalgorithmus beruht auf einem Abstandsfolgenklassifikator (euklidischer Abstand), der in<br />
seinen Randbedingungen an die vorliegende Aufgabe angepasst wurde.<br />
In der Vergleichsstufe wurde nun für jedes Messsignal das aus dem jeweils ungestörten Signal manuell<br />
extrahierte Korotkow-Geräusch mit Hilfe der oben angeführten Klassifikationsstrategie im gestörten<br />
Signal gesucht <strong>und</strong> entsprechend Anfangs- <strong>und</strong> Endpunkt detektiert.<br />
Unter Vernachlässigung der offensichtlich durch grobe Messfehler beeinträchtigten Messsignale in der<br />
vorliegenden Stichprobe wurden mit dem beschriebenen Mustererkennungsansatz ca. 60 % Signaldetektion<br />
erreicht (156 Messsignale). Das Ergebnis kann verbessert werden, wenn das sehr „harte“<br />
Klassifikationskriterium (Summe der Abweichungen von absoluter Anfangs- <strong>und</strong> Endposition des<br />
Korotkow-Geräuschs) dahingehend verändert wird, dass die relativen Positionen zueinander stärker<br />
bewertet werden.<br />
38
Forschung<br />
Abbildung 25 zeigt die Abhängigkeit der Detektionsrate vom Klassifikationskriterium (Summe der Abweichungen<br />
von detektiertem Anfangs- <strong>und</strong> Endpunkt des Korotkowgeräuschs in mmHg).<br />
Literatur zu 3.2.1<br />
Abbildung 25: Klassifikationsergebnis in Abhängigkeit vom Klassifikationskriterium.<br />
[1] R. Hoffmann, M. Eichner, S. Werner, and M. Wolff, „The Project UASR (Unified Approach for<br />
Speech Synthesis and Recognition) – A Progress Report“, Proc. Speech Processing Workshop,<br />
DAGM 2003, Magdeburg, Germany, p. 17-24.<br />
[2] M. Eichner, M. Wolff and R. Hoffmann, „Voice characteristics conversion for TTS using reverse<br />
VTLN“, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 17-20 , 2004.<br />
[3] S. Werner, M. Eichner, M. Wolff and R. Hoffmann, „Modelling Pronunciation Variation for<br />
Spontaneous Speech Synthesis “, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 673-676 ,<br />
2004.<br />
[4] C. Tschöpe, D. Hentschel, M. Wolff, M. Eichner and R. Hoffmann, „Classification of non-speech<br />
acoustic signals using structure models“, Proc. ICASSP 2004, Montreal, Canada, Vol. 5 , pp. 653-<br />
656, 2004.<br />
[5] M. Kühne, M. Wolff, M. Eichner and R. Hoffmann, „Voice activation based on prosodic keyword<br />
verification”, Proc. INTERSPEECH, Jeju, South Korea, 2004.<br />
[6] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop Speech<br />
Processing, September 13 – 15, 2004, Prague, 12 – 15.<br />
[7] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen. Studienarbeit TU <strong>Dresden</strong><br />
2004.<br />
3.2.3 Sprachsynthese<br />
a) Gr<strong>und</strong>lagenforschung Prosodie – Optimierung des Integrierten Modells<br />
In den Jahresberichten 2002 <strong>und</strong> 2003 wurde das Integrierte Prosodiemodell des Deutschen (IGM)<br />
vorgestellt. Es arbeitet NN-trainingsbasiert <strong>und</strong> generiert Fujisaki-Ansteuerparameter zur Erzeugung<br />
der Gr<strong>und</strong>frequenzkontur, Silben- <strong>und</strong> Pausendauern sowie Intensitätsverläufe. Das IGM kann mit<br />
verschieden Sprecher- <strong>und</strong> Sprechstildaten trainiert werden. Die Anwendbarkeit auf andere Sprachen<br />
wurde nachgewiesen.<br />
Im Zuge der weiteren Optimierung des Ansatzes wurden die einzelnen Parameter (wie z. B. die<br />
Sprechintensität, vgl. Jahresbericht 2003) genauer untersucht. Es wurden folgende Ansatzpunkte für<br />
eine Optimierung des IGM identifiziert:<br />
39
Verringerung des MSE gegenüber MFN (%) _<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
-5<br />
-10<br />
Weglassen außerhalb von |3S|<br />
ein Eingang |3S|<br />
zwei Eingänge ±3S<br />
Forschung<br />
AA T1_DI T2_DI AP_L DIST_ PAUSE DUR ENERG<br />
Untersuchter Parameter<br />
Abbildung 26: Automatische Markierung von Extremwert-Daten.<br />
• Berücksichtigung zusätzlicher Eingangsinformation: Das Modell berücksichtigte z. B. keine Elemente<br />
von Bedeutung, semantic focus oder abgeleitete Merkmale.<br />
• Strukturoptimierung des Neuronalen Netzwerkes: Die neuronale Struktur des Netzwerkkerns<br />
des IGM wurde entsprechend den Erfahrungen mit ähnlichen Prediktionsaufgaben implementiert.<br />
Ein evolutionärer Algorithmus soll Red<strong>und</strong>anzen in der Topologie reduzieren <strong>und</strong> die<br />
Signifikanz verbleibender Neuronen, Eingangsmerkmale, etc. in weiteren Trainingszyklen erhöhen.<br />
• Verringerung der Rechenkomplexität bzw. des Speicherverbrauchs: IGM konnte nicht in einem<br />
Embedded Text-to-Speech (TTS-)System implementiert werden.<br />
Zusätzliche Qualifizierung der IGM-Eingangsmerkmale (Ergebnisse)<br />
Eine semantische Erweiterung der Eingangsmerkmale des IGM ist in der Praxis kompliziert, da die<br />
entsprechenden Informationen nicht nur in der Trainingsdatenbasis zuverlässig markiert werden, sondern<br />
auch während der Kannphase im TTS-System vorliegen müssen.<br />
Als Zwischenschritt wurde getestet, welchen Einfluss die automatische Markierung von extremen Werten<br />
eines bestimmten Ausgabeparameters auf das Netztraining hat. Für jeden Ausgabeparameter<br />
wurde ein separates neuronales Netz trainiert. Dabei wurden je Parameter vier Konfigurationen untersucht:<br />
• Verwendung des ursprünglichen MFN ohne Änderungen (MFN),<br />
• Eliminierung aller Datensätze aus Trainings- <strong>und</strong> Testmenge, bei denen der Parameter außerhalb<br />
eines Vielfachen n der Standardabweichung S liegt (Weglassen > |nS|),<br />
• Ein zusätzlicher Eingang, ob der Parameter außerhalb eines bestimmten Vielfachen n der<br />
Standardabweichung liegt (ein Eingang > |nS|),<br />
• Zwei zusätzliche Eingänge, ob der Parameter positiv oder negativ außerhalb eines bestimmten<br />
Vielfachen der Standardabweichung liegt (zwei Eingänge, > +nS / < -nS).<br />
Das Training wurde mit Markierungen für die ein- bis dreifache Standardabweichung durchgeführt.<br />
Abbildung 26 zeigt die Ergebnisse für die dreifache Streuung. Bis auf einige Ausreißer beim Training<br />
ist gut zu erkennen, dass alle drei Konfigurationen ähnliche Verbesserungen der Prediktion nach sich<br />
ziehen. Besonders markant ist diese Beobachtung bei den zeitlichen Parametern T1, DIST (T0) bzw.<br />
PAUSE, wo sich der Fehler (MSE) um ca. 20% bis 30% reduziert. In Zusammenhang mit der geringen<br />
Anzahl an Datensätzen, welche dabei markiert werden mussten, ist zu vermuten, dass diese Extremwerte<br />
teilweise auf Label-Ungenauigkeiten in der Datenbasis zurückzuführen sind.<br />
40
Forschung<br />
Evolutionäre Topologieoptimierung des neuronalen Netzwerkkerns von IGM<br />
Evolutionäre Algorithmen (EA) sind Methoden zur stochastischen Optimierung, welchen den natürlichen<br />
Prozess von Evolution, Selektion <strong>und</strong> Variation simulieren. Aufgr<strong>und</strong> mehrerer Optimierungsparameter<br />
(multikriterielles Optimierungsproblem) sowie der Topologie des IGM fiel die Wahl auf den<br />
Strength Pareto Evolutionary Algorithm (SPEA).<br />
Die Struktur eines neuronalen Netzes ist durch zwei Extreme begrenzt: Auf der einen Seite kann das<br />
RMSE _<br />
0,175<br />
0,165<br />
0,155<br />
0,145<br />
0,135<br />
0,125<br />
1 3 5 7 9 11 13 15 17 19 21 23<br />
Netz so klein sein, dass es unfähig ist, alle Trainingsmuster <strong>und</strong> die darin liegenden Zusammenhänge<br />
vollständig zu lernen, auf der anderen Seite kann es zu groß sein, um die angebotenen Daten zu generalisieren<br />
<strong>und</strong> wird jeden Datensatz einzeln lernen. Durch die Nutzung von EA sollten folgenden<br />
Optimierungsziele erreicht werden:<br />
Anzahl Eingänge<br />
Mittelwert-Modell<br />
Originalnetz<br />
Abbildung 27: Optimierungsdurchläufe im Vergleich<br />
zur ursprünglichen Netzleistung.<br />
� Minimierung des mittleren quadratischen Fehlers (MSE bzw. RMSE),<br />
� Minimierung der Anzahl der Verbindungen,<br />
� Minimierung der Anzahl der Eingänge,<br />
� Minimierung der Anzahl der verdeckten Knoten.<br />
Das ursprüngliche MFN besteht aus 24 Eingängen, 744 Verbindungen, 30 verdeckten Knoten <strong>und</strong> 8<br />
Ausgängen. Der minimal beobachtete Overall-RMSE nach dem Training beträgt 0.139.<br />
Zwei größere Konfigurationen (mit 40 <strong>und</strong> 50 verdeckten Knoten) verhalten sich ähnlich wie das ursprüngliche<br />
Netz. Die Verwendung von SPEA zur Reduktion der generellen Netzwerk-Topologie durch<br />
Löschen von Knoten bzw. Verbindungen (wobei nach jedem Durchlauf ein erneutes MFN-Training<br />
mittels Backpropagation erfolgt) zeigt ebenfalls keine signifikante Änderung des resultierenden RMSE.<br />
Unter Berücksichtigung mehrstündiger Evolutionsdurchläufe wurde das Experiment nach einigen h<strong>und</strong>ert<br />
Iterationen beendet.<br />
Eine Reduktion der Eingangsanzahl mittels SPEA zeigt die beabsichtigte Wirkung. Ein optimiertes<br />
Netzwerk mit nur sechs Eingangsparametern verursacht eine RMSE-Erhöhung von lediglich 4.4%<br />
gegenüber dem Originalnetz (Abbildung 27). Frühere Korrelationsanalysen bestätigen, dass ca. 80 bis<br />
95% der Vorhersageleistung von nur 5-8 Eingabeparametern abhängen. Subjektive Tests zeigen keine<br />
hörbaren Unterschiede zwischen den optimierten bzw. den ursprünglich geschätzten Gr<strong>und</strong>frequenz-<br />
<strong>und</strong> Dauerverläufen.<br />
41
Inkonsistenz von Trainingsdaten<br />
Forschung<br />
Ein weiteres evolutionäres Experiment beschäftigte sich mit der korrekten Auswahl von Trainings- <strong>und</strong><br />
Testmustern. Während des ursprünglichen Trainings des IGM wurden die Aufnahmebedingungen des<br />
verwendeten Teils des Stuttgarter Nachrichtenkorpus als konstant angenommen. Da die SPEA jedoch<br />
eine spezifische Vorliebe für bestimmte Trainings- <strong>und</strong> Testmengen-Kombinationen aufzeigte, wurden<br />
Inkonsistenzen in den Trainingsdaten entdeckt – wie z. B. unterschiedliche RMS-Signalwerte, welche<br />
beispielsweise durch unterschiedliche Normierungen, wechselnde Aufnahmetechnik oder unterschiedliche<br />
Sprecher bzw. Sprechstile hervorgerufen werden können.<br />
Zusammenfassend wird eingeschätzt, dass die Datenabhängigkeit trainingsbasierter Prosodiemodelle<br />
generell stärker ist - als in früheren Arbeiten angenommen. Die algorithmische bzw. strukturelle Modellierung<br />
ist anscheinend in gewissen Grenzen flexibel.<br />
Literatur:<br />
O. Jokisch, M. Hofmann, Evolutionary Optimization of an Adaptive Prosody Model, Proc.<br />
INTERSPEECH (ICSLP), 797-800, Jeju, Korea, 2004.<br />
O. Jokisch, M. Hofmann, Optimierung einer trainingsbasierten Prosodiegenerierung für Sprachsynthese,<br />
Elektronische Sprachsignalverarb. (Proc. ESSV), 175-182, Cottbus, 2004.<br />
b) Sprachübergreifende Studie zu Glottalisierungseffekten<br />
Die Motivation der Studie ergibt sich aus der notwendigen Selektion von Inventarsprechern, z. B. für<br />
die Sprache Mandarin-Chinesisch sowie die Designunterschiede im Vergleich zu geeigneten Phonem-<br />
bzw. Diphontabellen für die Sprachen Englisch <strong>und</strong> Deutsch.<br />
Eine Glottalisierung ist eine Diskontinuität bzgl. der Periodizität des Sprachsignals, welche die Qualität<br />
konkatenativer Sprachsynthese während der Gr<strong>und</strong>frequenzmanipulation verschlechtern kann. Relevant<br />
sind Systematik <strong>und</strong> Position möglicher Glottalisierungen in verschiedenen Sprachen als auch<br />
geeignete Manipulationsalgorithmen.<br />
Das verwendete Sprachdatenmaterial umfasst Texte sowie isolierte Silben von acht Mandarin-<br />
Muttersprachlern, Texte von je 6 Muttersprachlern US- bzw. UK-Englisch <strong>und</strong> Texte zweier deutscher<br />
Sprecher. Weiterhin wurden Diphoninventare für US, UK <strong>und</strong> Deutsch untersucht.<br />
Amount<br />
150<br />
100<br />
50<br />
0<br />
� � � � � �<br />
� ßÞ �<br />
Á×ÓÐ�Ø�� ËÝÐÐ��Ð�<br />
� ßÞ �<br />
Ì�ÜØ<br />
Non-Tone3<br />
Voiceless<br />
glottal.<br />
normal<br />
Speaker<br />
Abbildung 28: Häufigkeit von Ton3-Varianten für acht Mandarin-<br />
Sprecher. Menge „Non-Tone3“ umfasst fehlerhafte Artikulationen.<br />
Zusammenfassend ergaben sich folgende Resultate:<br />
• Glottalisierungen sind generell schwer vorhersagbar <strong>und</strong> idiosynkratisch für bestimmte Äußerungen<br />
oder Sprecher.<br />
• Sie sind sprecherabhängig <strong>und</strong> erscheinen häufig an initialen <strong>und</strong> manchmal an wort-finalen<br />
Vokalen in allen genannten Sprachen.<br />
• In Mandarin treten Glottalisierungen häufig im Zentrum des Tons 3 <strong>und</strong> manchmal am Ende<br />
des Tons 4 auf (tiefere Gr<strong>und</strong>frequenzpositionen), vgl. auch Abbildung 28.<br />
• Die Auftretenswahrscheinlichkeit an silben-initialen Vokalen ist in Deutsch größer als in Englisch,<br />
aufgr<strong>und</strong> der speziellen Silbenstruktur des Deutschen.<br />
42
Forschung<br />
Die Autoren schlagen eine differenzierte Behandlung der Glottalisierung in jeder Sprache vor. Solange<br />
der Inventarsprecher in seinen Trägerwörtern keine oder wenige Glottalisierungen generiert, erscheint<br />
es unnötig, separate Phoneme für Glottalisierung oder Glottisverschluss zu definieren. Für deutsche<br />
Sprachsynthese sollte Glottalisierung jedoch Phonemstatus erhalten <strong>und</strong> bei der Inventaraufnahme<br />
entsprechend provoziert werden. Betrachtet man die Vielfalt natürlicher Sprache <strong>und</strong> möchte verschiedene<br />
Sprecher, Sprechstile oder ggf. Emotionen synthetisieren, sollte Glottalisierung allerdings<br />
generell modelliert werden.<br />
Literatur:<br />
H. Ding, O. Jokisch, R. Hoffmann, Glottalization in Inventory Construction: A Cross-Language Study,<br />
Proc. ISCSLP, 37-40, Hongkong, 2004.<br />
c) Entwicklungsarbeiten zur Embedded-Sprachsynthese<br />
Sprachsynthese mit geringem Speicherbedarf stellt weiterhin eine Hauptforschungs- <strong>und</strong> Entwicklungsrichtung<br />
am Institut dar. Die entsprechenden Arbeiten zum TTS-System microDRESS <strong>und</strong> die<br />
Siemenskooperation bei der Entwicklung des Systems Papageno Embedded wurden bereits in den<br />
Jahresberichten 2002 <strong>und</strong> 2003 ausführlich beschrieben. Ein entsprechendes Produkt für Deutsch<br />
<strong>und</strong> US-Englisch wird derzeit vermarktet.<br />
Die Arbeiten im Kalenderjahr 2004 konzentrierten sich auf zwei Bereiche:<br />
• Weiterentwicklung der Kerntechnologie: Inventarkodierung <strong>und</strong> akustische Synthese,<br />
• Konzeption <strong>und</strong> Entwicklung weiterer Sprachressourcen (Projekt „New Languages“).<br />
Die Entwicklung der Kerntechnologie läuft synchron zur TUD-eigenen Forschung <strong>und</strong> wird im folgenden<br />
Abschnitt d) beschrieben. Es entstand u. a. eine neuartige Synthesemethode (DFI-SS), die zur<br />
Patentierung angemeldet wurde <strong>und</strong> eine interessante Alternative, z. B. zu PSOLA, darstellt.<br />
Im Folgenden werden die Arbeiten des Projekts „New Languages for Papageno“ dargestellt. Neben<br />
den Stammmitarbeitern der Sprachsynthese wurden diese Arbeiten durch ein Team von Muttersprachlern<br />
(beratende Linguisten <strong>und</strong> Sprachlehrer, <strong>Diplom</strong>anden, etc.) durchgeführt.<br />
Datenbasenkonzept, Sprecherauswahl<br />
Das bereits für microDRESS realisierte Synthesekonzept sieht eine strikte Code-Daten-Trennung vor.<br />
Der akustische Modul ist trotz seiner algorithmischen Effizienz flexibel bezüglich der Basiseinheiten<br />
(Diphon, Silbe, etc.) <strong>und</strong> ermöglicht auch die Selektion aus Varianten (Korpussynthese).<br />
Bei der Integration neuer Sprachen bzw. neuer Sprecherdatenbasen waren allerdings dennoch bestimmte<br />
sprach- oder sprecherspezifische Merkmale zu beachten, u. a.:<br />
• Vorverarbeitungskonforme Phonem- bzw. Diphonsets: Je nach verwendeten Algorithmen/ Lexika<br />
variierten die Spezifikationen (SAMPA, X-SAMPA, TUD, SIEMENS-CT),<br />
• Eignung des Inventarsprechers für die verwendete Inventarkodierung (z. B. AMRWB) bzw. die<br />
Synthesemethode (z. B. PCM/ TD-PSOLA, DFI-SS, etc.),<br />
• ggf. Berücksichtigung von Glottalisierungseffekten.<br />
Die Sprecherauswahl wurde auf Basis von Hörtests objektiviert, wobei sprachenabhängig 5-8 Sprecherinnen<br />
(R<strong>und</strong>funkmedien, Linguistik, Lehrer, Studenten) zur Auswahl standen. Die Bewertung erfolgte<br />
auf Basis von bis zu 6 Beispielphrasen <strong>und</strong> wurde sowohl von jeweils 20 Muttersprachlern als<br />
auch von Expertenhörern aus der Sprachtechnologie (TUD <strong>und</strong> Siemens) durchgeführt.<br />
Interessanterweise wurden teilweise (z. B. Französisch oder Niederländisch) nicht die „professionellsten<br />
Stimmen“ ausgewählt, was in gewissem Widerspruch zur üblichen subjektiven Sprecherauswahl<br />
steht. Außerdem hatte das Kodierungsverfahren einen teilweise wesentlichen Einfluss auf Stimmpräferenzen<br />
bzw. verringerte manchmal die Signifikanz der Auswahl (Unterschiedliche Bewertungen wurden<br />
stark nivelliert, d. h. die Sprachqualität hing v. a. vom Kodierungsverfahren ab, obwohl z. B. das<br />
AMRWB-Verfahren bezüglich Standardbewertungen (wie MOS) sehr gut abschneidet.<br />
Ebenfalls überraschend war die Tatsache, dass Expertenurteile in der Regel gut mit Muttersprachlerurteilen<br />
korrelieren, auch wenn die Sprachkenntnis nicht oder nur beschränkt vorhanden war.<br />
43
Forschung<br />
Literatur:<br />
O. Jokisch, G. Strecha, H. Ding: Multilingual Speaker Selection for Creating a Speech Synthesis<br />
Database, Proc. AST Workshop, Maribor, Slovenia, 2004 (in press).<br />
Generierung von Sprechertexten, Studioaufnahmen<br />
Um die Generierung von neuen Sprachressourcen zu beschleunigen, wurden mehrere neue Tools<br />
entwickelt, welche im Wesentlichen die vorverarbeitungskonforme Definition von Phonem- bzw.<br />
Diphontabellen <strong>und</strong> die automatische Bereitstellung von Sprechtexten (z. B. Trägerwörter) betreffen<br />
wie z. B. das Programm lex2diph. Der manuelle Bearbeitungsaufwand konnte erheblich reduziert werden.<br />
Die umfangreichen Sprachaufnahmen wurden entsprechend dem Stand der Technik im Studio des<br />
<strong>IAS</strong> durchgeführt (Grossmembran-Mikrofon, Laryngograph, Recordingsoftware), wobei neben der<br />
Sprecherin jeweils ein Techniker <strong>und</strong> ein linguistisch-phonetisch vorgebildeter Muttersprachler anwesend<br />
war, um die Qualitätsanforderungen sicherzustellen.<br />
Neben dem Basismaterial für die Inventarerstellung (jeweils mehrere tausend Wörter) wurde je Sprache<br />
zusätzlich ein Prosodiekorpus von 1.000-1.300 Phrasen aufgenommen <strong>und</strong> segmentiert, welcher<br />
für das Training der entsprechenden Prosodiemodelle genutzt wird.<br />
Sprachdatenbearbeitung <strong>und</strong> Inventargenerierung<br />
Die notwendigen automatischen <strong>und</strong> manuellen Arbeiten zur Sprachdatenbearbeitung wie Segmentierung/<br />
Labeln, Periodenmarkierung, iterative Optimierung wurden bereits in früheren Jahresberichten<br />
beschrieben, laufen weitestgehend standardisiert ab <strong>und</strong> stellen keine Forschung oder Entwicklung im<br />
eigentlichen Sinne dar.<br />
Trotz verbesserter Technologie, z. B. Phoneme Aligner, ist der manuelle Aufwand nach wie vor vergleichsweise<br />
hoch, um sprach übergreifend Inventare mit hoher <strong>und</strong> vor allem uniformer, akustischer<br />
Qualität zu generieren. Der iterative Optimierungsprozess nimmt ca. 2-3 Personenmonate in Anspruch.<br />
Neben den bereits realisierten Datenbasen für Deutsch <strong>und</strong> US-Englisch wurden am <strong>IAS</strong> im Jahr 2004<br />
weibliche Syntheseinventare für folgende Sprachen entwickelt <strong>und</strong> fertig gestellt: UK-Englisch, Kastellan-Spanisch<br />
sowie Italienisch. Derzeit befindet sich ein niederländisches Inventar in der Entwicklung.<br />
In Kooperation mit der voiceINTERconnect <strong>Dresden</strong> GmbH entstand außerdem ein französisches<br />
Syntheseinventar.<br />
Alle Inventare erfüllen die microDRESS- bzw. Papageno Embedded-Spezifikation <strong>und</strong> benötigen je<br />
nach Sprache, Qualitätsstufe <strong>und</strong> Kodierung nur 220 bis 1.100 kB Speicher.<br />
d) AMR-WB-basierte akustische Synthese<br />
Für ein Projekt wurde der neben dem im vergangenen Jahr implementierten AMR-NB (Adaptive Multi<br />
Rate Narrowband)-Dekoder der AMR-WB (Wideband) für die akustische Synthese angepasst. Mit<br />
dem entsprechenden AMR-WB-Kodierer wurden die Inventare erzeugt.<br />
Der AMR-WB-Koder ist, wie der AMR-NB-Koder, ein CELP (Code Excited Linear Prediction) -basierter<br />
Algorithmus. Er arbeitet, im Gegensatz zum AMR-NB intern bei einer Abtastrate von 12.8 kHz. Nach<br />
der Synthese des Sprachsignals durch Filterung des Residualsignals mit den LPC-Koeffizienten findet<br />
ein Hochsamplen auf 16 Khz Abtastrate <strong>und</strong> eine Anreicherung mit höheren Frequenzen, welche aus<br />
dem unteren Frequenzbändern geschätzt werden.<br />
Zum Dekoder übertragen werden die aus den LPC (linear predictive coding) -Koeffizienten ermittelten<br />
LSP (line spectral frequencies) -Koeffizienten <strong>und</strong> Periodenmarkeninformationen sowie die Kodebuchindizees<br />
für die Rekonstruktion des Anregungs- bzw. Residualsignals.<br />
Die akustische Synthese greift vor der Filterung ein, indem die Periode des Anregungssignal durch<br />
ein zeitbasiertes Verfahren manipuliert wird, um die von der Vorverarbeitung generierten Gr<strong>und</strong>frequenzkontur<br />
aufzuprägen. Die Phonemdauern werden durch Einfügen bzw. Auslassen von Anregungssignalperioden<br />
<strong>und</strong> Filterkoeffizienten gesteuert.<br />
44
Inventargenerierung <strong>und</strong> Inventargrößen<br />
Forschung<br />
Ähnlich der Vorgehensweise beim AMR-NB wurden die AMR-WB-Inventare durch bausteinweises<br />
Kodieren erzeugt. Entsprechen den neun Skalierungsstufen des Koders entstanden neun Inventare<br />
pro Inventarstimme. Beispielgrößen eines deutschen Inventars (weibliche Sprecherin) sind in folgender<br />
Tabelle zusammengestellt:<br />
kBit/s: 23,85 23,05 19,85 18,25 15,85 14,25 12,65 8,85 6,6 original<br />
Inventargröße/<br />
Byte:<br />
84858<br />
4<br />
82224<br />
8<br />
71728<br />
8<br />
66480<br />
8<br />
58618<br />
4<br />
53370<br />
4<br />
48122<br />
4<br />
35677<br />
6<br />
28269<br />
8<br />
659696<br />
8<br />
Alle Inventare des Projektes wurden als ROM-Image generiert, d. h., während der Synthese können<br />
keine Änderungen am Inventar vorgenommen werden. Außerdem wurden auf Platformunahbängigkeit<br />
geachtet, wie z. B. Ausrichten (Alignment) der Datentypen an Zeigeradressen. Die entsprechenden<br />
Änderungen am Programmkode der Synthese wurden vorgenommen, sowie die vollständige Umstellung<br />
auf Festkommaarithmetik.<br />
e) Sprechendes Wörterbuch<br />
Wie aus dem Jahresbericht 2003 bekannt ist, entwickelt das Institut für Sprechwissenschaft <strong>und</strong> Phonetik<br />
der Martin-Luther-<strong>Universität</strong> Halle-Wittenberg ein neues Wörterbuch der deutschen Aussprache,<br />
das mit der Möglichkeit versehen werden soll, die Normaussprache gewünschter Wörter mit Hilfe<br />
von Sprachsynthese anhören zu können. Die dafür erforderliche Synthesekomponente wird von unserer<br />
Arbeitsgruppe als Ableitversion von DRESS unter der bezeichnung lexDRESS entwickelt.<br />
Wesentlicher Bestandteil des Projektes ist die Entwicklung einer Diphon-Datenbasis unter Einbeziehung<br />
sprechwissenschaftlicher Expertise. Die Definition einer solchen Datenbasis erfolgte 2003. Im<br />
Berichtsjahr wurden die Trägerwörter von einer geschulten Sprecherin gesprochen, <strong>und</strong> die Diphone<br />
wurden extrahiert.<br />
Als experimentelle Basis wurde von Herrn Sobe eine Oberfläche entwickelt, unter der eine erste Version<br />
von lexDRESS einfach benutzbar ist, indem man die zu sprechenden Wörter in Rechtschrift, der<br />
IPA-Transkription <strong>und</strong> der Transkription mit extended SAMPA darstellen <strong>und</strong> editieren kann.<br />
Da das Projekt ausschließlich durch Haushaltmittel finanziert wird, gelang im Berichtsjahr lediglich die<br />
Erstellung <strong>und</strong> Evaluierung von Synthese-Beispielen unter Benutzung der Rohschnitt-Diphone (siehe<br />
den Bericht zum Projektstand auf der Konferenz ESSV 2004). Damit liegen alle Voraussetzungen für<br />
eine Systemoptimierung im kommenden Jahr vor.<br />
3.2.4 Entwicklung einer Text-To-Speech-Applikation <strong>und</strong> dynamischer<br />
Bewertungsverfahren<br />
Dieses Projekt ist seit Mai 2004 unser Anteil an einem AiF-geförderten Vorhaben mit dem Thema<br />
„Entwicklung eines Selbstlernsystems mit Mehrkanal-Rückkopplung für das Training der deutschen<br />
Aussprache“ (kurz AZAR = Apparat zur Akzentreduzierung), an dem insgesamt die Partner Gesellschaft<br />
für Wissens- <strong>und</strong> Technologietransfer der TUD, voiceINTERconnect GmbH <strong>Dresden</strong> <strong>und</strong> REZO<br />
Computerservice GmbH & Co. KG <strong>Dresden</strong> beteiligt sind. Ziel des Projektes ist die Entwicklung eines<br />
multimedialen Sprachtrainers zum Erlernen der deutschen Aussprache. Für die Entwicklung komplexer<br />
Feedback-Funktionen werden Verfahren der Spracherkennung <strong>und</strong> der Sprachsynthese eingesetzt,<br />
die das dynamische Detektieren akzentbedingter Abweichungen von der Standardlautung ermöglichen.<br />
Zusätzlich zur akustischen Ein- <strong>und</strong> Ausgabe sind visuelle Feedbackfunktionen (graphische<br />
Ausgabe akustischer Parameter, Darstellung der artikulatorischen Abläufe in sagittaler Projektion<br />
durch Animationssequenzen, Darstellung der Lippenartikulation) vorgesehen. Die Komplexität der<br />
Aufgabenstellung resultiert aus der Zusammenführung von Verfahren der akustischen Sprachsignalanalyse<br />
<strong>und</strong> der Modellierung artikulatorischer Abläufe in einem interaktiven System. Im Rahmen des<br />
Projektes wird der Versuch unternommen, das artikulatorische Modell aus einem Code zu generieren,<br />
der sich direkt auf das akustische Sprachsignal bezieht.<br />
Entsprechend der in den Arbeitspaketen festgelegten Aufgabenverteilung wurden im angegebenen<br />
Zeitraum die wesentlichen Arbeiten zur Gewinnung <strong>und</strong> Aufbereitung der Datenbasis abgeschlossen<br />
sowie linguistische Untersuchungen der gewonnenen Daten durchgeführt. Zunächst wurden phonetisch<br />
ausgewogene Textkorpora zur Erhebung der Leseaussprache (Testsätze, Wortformen, Wortgruppen,<br />
Lesetexte) sowie Aufgaben (Sprechimpulse) für die Erhebung spontansprachlicher Fertigkei-<br />
45
Forschung<br />
ten erstellt. Die Textkorpora wurden phonemisch in SAMPA transkribiert. Nach Probeaufnahmen mit<br />
zwei Probanden im Mai 2004 erfolgte die Optimierung der Textbasis. Durch individuelles Coaching<br />
wurden 10 erwachsene Lerner unterschiedlicher Niveaustufen (Migranten aus dem ostslawischen<br />
Raum) auf die Tests vorbereitet. Für die Erhebung der muttersprachlichen Referenzdaten, die für die<br />
Entwicklung von Spracherkennungssoftware unerlässlich sind, wurde eine phonetisch ausgewogene<br />
Textbasis in russischer Sprache erstellt. Im Juli wurden Audioaufnahmen durchgeführt, die als Ausgangsbasis<br />
für das Annotieren der Sprachdaten dienten. Die manuell segmentierten <strong>und</strong> kanonisch<br />
gelabelten Sprachdaten werden linguistisch analysiert <strong>und</strong> statistisch ausgewertet. Im Ergebnis der<br />
statistischen Auswertung werden die Schwellwerte akustischer Parameter für die Unterscheidung der<br />
Akzentaussprache von akzentfreien Realisationen bestimmt.<br />
Im Oktober 2004 wurden mit 8 Lernenden aus Osteuropa <strong>und</strong> 10 muttersprachlichen deutschen Sprechern<br />
die Korpusdaten in vollem Umfang aufgezeichnet. Die akustischen Aufzeichnungen wurden<br />
dabei mit Videoaufnahmen der Lippenartikulation synchronisiert. Im Ergebnis der linguistischvergleichenden<br />
Untersuchung der gewonnenen Sprachdaten ist eine maschinenlesbare Notation für<br />
die akzentbedingten Abweichungen entstanden. Es handelt sich hierbei um eine Hybrid-Notation aus<br />
den SAMPA-Zeichensätzen für Standarddeutsch <strong>und</strong> die russische Literatursprache. Damit wurde<br />
eine wesentliche Voraussetzung für die Entwicklung akustischer Feedback-Funktionen geschaffen.<br />
Die gegenwärtig laufenden phonetischen Analysen verfolgen das Ziel, akzentrelevante realisationsphonetische<br />
Merkmale zu ermitteln, die im Selbstlernsystem automatisch extrahiert werden sollen.<br />
3.2.5 Sprachsteuerung eines Computerspiels<br />
Die Spracherkennung <strong>und</strong> Sprachsynthese haben trotz langjähriger intensiver Forschung vergleichsweise<br />
wenig praktischen Einsatz erfahren. Die Gründe dafür sind an unterschiedlichen Stellen zu suchen.<br />
Einerseits sind Akzeptanzprobleme zu nennen, da die synthetische Sprache je nach Ressourceneinsatz<br />
deutlich schlechter als die natürliche Sprache ist <strong>und</strong> die Spracherkennung mit einer gewissen<br />
Fehlerrate verb<strong>und</strong>en ist. Des Weiteren setzt sich die Sprachtechnologie gegenüber etablierten<br />
Methoden des Dialoges nicht durch, wenn die Vorteile der neuen Dialogführung nicht überwiegen.<br />
Zu guter Letzt muss diese Problematik auch aus der Position der Anwendung betrachtet werden, da<br />
sich nicht automatisch jedes Medium zur Dialogführung eignet. In einer <strong>Diplom</strong>arbeit wurde anhand<br />
eines Computerspiels der Einsatz von Sprachtechnologie untersucht <strong>und</strong> anhand von Nutzerbefragungen<br />
evaluiert. Dabei wurden besonders ergonomische Kriterien beachtet. Die Ergebnisse dieser<br />
Arbeit lassen sich wie folgt zusammenfassen:<br />
1. Die Spracheingabe erfordert, ebenso wie die Mausbedienung, eine Lernphase. Dabei ist in beiden<br />
Fällen eine Adaption des Menschen auf das jeweilige System zu beobachten.<br />
2. Die Verwendung von Spracheingabe vereinfacht durch ihre Vielseitigkeit das Dialogmodell der<br />
Anwendung.<br />
3. Sprachbedienung ist gr<strong>und</strong>sätzlich langsamer als die Bedienung mit der Maus. Damit die Sprachbedienung<br />
der Mausbedienung vorgezogen wird, muss dieser Nachteil durch andere Vorzüge<br />
ausgeglichen werden.<br />
4. Die Sprachsynthese ist nicht auf einem Stand, wo sie mit natürlicher Sprache vergleichbar ist. Die<br />
Anwendung als Zusatz zur Textausgabe auf dem Bildschirm wird jedoch akzeptiert.<br />
5. Konfidenzmaße bei der Spracherkennung ermöglichen eine Bewertung der Qualität der Erkennung.<br />
Sie müssen jedoch bei jedem Einsatzfall auf ihre Eignung überprüft werden.<br />
6. Die Eignung einer Anwendung für die Bedienung mit natürlicher Sprache ist nicht automatisch<br />
gegeben, sondern muss untersucht werden. Die Sprache ist u. U. nicht oder nur in Verbindung mit<br />
anderen Eingabeformen (z. B. Haptik) einsetzbar.<br />
7. Die Bewertung der Ergonomie ist abhängig von den Anforderungen an den Benutzer, das System<br />
<strong>und</strong> die Anwendung. Generelle Aussagen über die ergonomischen Eigenschaften sind deshalb<br />
nur sehr allgemein möglich, die Untersuchung muss vielmehr für jeden Anwendungsfall gesondert<br />
durchgeführt werden.<br />
Literatur: D. Sobe, M. Eichner, “Sprachsteuerung eines Computerspiels- Untersuchungen zur Leistungsfähigkeit<br />
<strong>und</strong> Ergonomie”,15. Konferenz ESSV = Studientexte zur Sprachkommunikation Bd. 30,<br />
S. 292-299.<br />
46
Forschung<br />
3.2.6 Historische phonetische Geräte<br />
Wie in früheren Jahresberichten bereits angekündigt wurde, besteht das Ziel, die <strong>Dresden</strong>er Sammlung<br />
historischer phonetischer Geräte durch eine ausführliche Web-Präsentation zu erschließen. Im<br />
Berichtsjahr wurde durch die Herren Prof. Mehnert <strong>und</strong> Dr. Dietzel daran zielstrebig weitergearbeitet.<br />
Es liegen jetzt digitalisierte Bilder vollzählig vor, die Schritt für Schritt durch kurze Beschreibungen der<br />
Exponate ergänzt werden.<br />
Auch bei der Instandsetzung <strong>und</strong> Präsentation der Geräte konnten Fortschritte erzielt werden. Abbildung<br />
29 zeigt ein Beispiel. Durch die Präsentation der Ergebnisse auf geeigneten Veranstaltungen<br />
konnten Kontakte geknüpft werden, die zeigen, dass ein deutliches Interesse an der Aufarbeitung <strong>und</strong><br />
Sicherung der Zeugnisse der Vergangenheit unseres Fachgebietes besteht. Zu erwähnen wäre dabei<br />
besonders der Budapester Workshop zum 200. Todestag von Wolfgang von Kempelen.<br />
Abbildung 29: Restaurierung eines Kymographen mit Ausrüstung für die Gr<strong>und</strong>frequenzmessung.<br />
Links: Vorbild für die Rekonstruktion (Panconcelli-Calzia: Das Hamburger experimentalphonetische<br />
Praktikum, I. Teil, 1922). Rechts: Die rekonstruierte Anordnung aus Universal-Kymograph, Kehltonschreiber,<br />
Chronograph <strong>und</strong> Universalstativ. Foto: R. Dietzel.<br />
47
Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />
4 Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />
4.1 Drittmittelprojekte<br />
Verbrennungslärm: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern<br />
2002 – 2005<br />
DFG-Forschergruppe „Verbrennungslärm“, Teilprojekt 4 (KO1242/10-1, /10-2)<br />
Projektleiter: Prof. Dr. P. Költzsch, Prof. Dr. M. Ochmann<br />
Bearbeiter: Dipl.-Ing. H. Brick, Dr. R. Piscoya<br />
Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen <strong>und</strong><br />
Oberflächendruckfelder<br />
2001-2004<br />
DFG-Projekt (KO 1242/6-3, /6-4)<br />
DFG/BMBF-Verb<strong>und</strong>projekt: 4 <strong>Universität</strong>en, DLR Braunschweig<br />
Projektleiter: Prof. Dr. P. Költzsch<br />
Bearbeiter: Dipl.-Ing. M. Bauer, Dipl.-Ing. A. Zeibig, Dr. A. Borisyuk, Dipl.-Ing. D. Richter<br />
Experimentelle Untersuchungen zur Validierung von aeroakustischen Quellgrößen <strong>und</strong> CAA-<br />
Rechnungen<br />
2001-2004<br />
Auftraggeber: DLR, Deutsches Zentrum für Luft- <strong>und</strong> Raumfahrt, Institut für Aerodynamik <strong>und</strong> Strömungstechnik,<br />
Braunschweig<br />
Projektleiter: Prof. Dr. P. Költzsch<br />
Bearbeiter: Dipl.-Ing. A. Zeibig<br />
Akustische Simulationsverfahren: Vorausberechnung von Strömungs- <strong>und</strong> Körperschall bei<br />
typischen Fahrzeugstrukturen mit dem Ziel der Lärmminderungsprognose<br />
Forschungsverb<strong>und</strong> „Leiser Verkehr“ (DLR, EADS München, TU <strong>Dresden</strong>)<br />
2001-2004<br />
Koordinator <strong>und</strong> Teilprojektleiter Strömungsschall: Prof. Dr. P. Költzsch<br />
Teilprojektleiter Körperschall: Dr. E. Sarradj<br />
Bearbeiter: Dr. E. Sarradj, Dipl.-Ing. B. Knöfel, Dr. A. Borisyuk, FhI IS <strong>Dresden</strong>,<br />
AFD <strong>Dresden</strong><br />
Entwicklung <strong>und</strong> Testung neuer lärmabsorbierender Werkstoffe auf der Basis metallischer<br />
Hohlkugelstrukturen<br />
2002-2004<br />
Auftraggeber: Fraunhofer-Gesellschaft, Institut für Angewandte Materialforschung (IFAM)<br />
Projektleiter: Prof. Dr. P. Költzsch<br />
Bearbeiter: Dipl.-Ing. J. Hübelt, Dr. E. Sarradj<br />
Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur lärmoptimalen<br />
Gestaltung der Bauteile von Verkehrsmitteln<br />
2004<br />
Projektförderung durch die Friedrich-<strong>und</strong>-Elisabeth-BOYSEN-Stiftung<br />
Projektleiter: Prof. Dr. P. Költzsch<br />
Bearbeiter: Dipl.-Ing. A. Witing, Dr. V. Bormann, Student M. W. Kettlitz, Dipl.-Ing. A. Zeibig, Dipl.-Ing.<br />
M. Bauer<br />
DFG-Sonderforschungsbereich 639 „Textilverstärkte Verb<strong>und</strong>komponenten für funktionsintegrierende<br />
Mischbauweisen bei komplexen Leichtbauanwendungen“<br />
Teilprojekt D3: Integrierte Sensornetzwerke<br />
2004-2007<br />
Projektlieter des <strong>IAS</strong>: Prof. Dr. G. Pfeifer<br />
Bearbeiter: Dipl.-Ing. S. Folprecht, Dipl.-Ing. E. Starke,<br />
Dipl.-Ing. J. Landgraf<br />
48
Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />
Ultraschallwandler für gerichtete Audioabstrahlung<br />
1999 - 2004<br />
Auftraggeber: Sennheiser electronic GmbH<br />
Bearbeiter: Prof. Dr. G. Pfeifer<br />
Mikrofon mit weitgehend frequenzunabhängiger Richtcharakteristik<br />
Auftraggeber: Microtech Gefell<br />
2003-2004<br />
Bearbeiter: Dipl.-Ing. D. Richter<br />
Bestimmung von Kenngrößen eines Telefonhörers<br />
Auftraggeber: Kommunikationstechnik PRAGMA Zittau<br />
2004<br />
Bearbeiter: Dr. G. Fuder<br />
Integration von Spracherkennung <strong>und</strong> –synthese unter Verwendung gemeinsamer Datenbasen<br />
2001 – 2005<br />
DFG-Projekt HO 1674/7<br />
Projektleiter: Prof. Dr. R. Hoffmann<br />
Bearbeiter: Dipl.-Ing. M. Cuevas, T. Oba, M.A.<br />
Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer Prozesse basierend<br />
auf spektralen Repräsentationen akustischer Vorgänge<br />
2004 – 2005<br />
DFG-Projekt HO 1674/8-1<br />
Gemeinschaftsprojekt mit Fraunhofer Institut für zerstörungsfreie Prüfverfahren, Außenstelle <strong>Dresden</strong><br />
Projektleiter IZFP: Dr.-Ing. D. Hentschel<br />
Projektleiter TUD: Prof. Dr. R. Hoffmann<br />
Bearbeiter: Dipl.-Inf. C. Tschöpe, Dipl.-Ing. S. Werner<br />
Nichtinvasive Blutdruckmessung am aktiven Menschen<br />
2004 – 2005<br />
Ges<strong>und</strong>heitstechnik Stier, Neuruppin<br />
Projektleiter: Prof. Dr. R. Hoffmann<br />
Bearbeiter: Dr. U. Kordon, Dipl.-Ing. H. Hussein<br />
Industrielle Anwendungen der technischen Sprachkommunikation<br />
2004<br />
Gesellschaft für Wissens- <strong>und</strong> Technologietransfer der TU <strong>Dresden</strong> mbH,<br />
Servicebereich „Signalverarbeitung <strong>und</strong> Mustererkennung“<br />
Hauptanwender im Berichtsjahr: Siemens AG<br />
Projektleiter: Prof. Dr. R. Hoffmann, Dr. U. Kordon, Dipl.-Ing. O. Jokisch<br />
Erstellung einer Sprachdatenbank für Sprachsynthese <strong>und</strong> Sprachkonversion<br />
2004 - 2005<br />
Siemens CT München, Unterauftrag im EU-Projekt TC-STAR<br />
Projektleiter: Prof. Dr. R. Hoffmann<br />
Entwicklung einer Text-to-Speech-Applikation <strong>und</strong> dynamischer Bewertungsverfahren<br />
für ein Selbstlernsystem für die deutsche Aussprache (AZAR)<br />
2004 – 2006<br />
Zuwendung des BMBF im Rahmen des Programmes PRO INNO an die<br />
Gesellschaft für Wissens- <strong>und</strong> Technologietransfer der TU <strong>Dresden</strong> mbH<br />
Bearbeiter: Dipl.-Slaw. R. Jäckel, Dipl.-Ing. M. Lachmann<br />
Projektpartner: voiceINTERconnect GmbH <strong>Dresden</strong>, REZO Computer-Service <strong>Dresden</strong><br />
Zweisprachiges Sprachsynthesesystem deutsch-tschechisch<br />
2004 – 2007<br />
DAAD-Programm Ostpartnerschaften<br />
Kooperation mit Karls-<strong>Universität</strong> Prag <strong>und</strong> TU Prag<br />
Bearbeiter TUD: Dr. U. Kordon<br />
49
Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />
4.2 Haushaltfinanzierte Forschungsaufgaben<br />
Ultraschallsicherheit diagnostischer Geräte<br />
Schallfeldmodellierungen – Suche nach „hot spots“, Schallabsorption <strong>und</strong> –streuung, Wärmeleitung in<br />
festen <strong>und</strong> fluiden Medien<br />
2001 – 2004<br />
Doz. Dr. E. Kühnicke<br />
Ultraschallbildgewinnung<br />
Einsatz <strong>und</strong> Bildverarbeitung für 3D-US-Daten, Modellierung des US-Aufnahmeprozesses<br />
2002-2004<br />
Doz. Dr. E. Kühnicke<br />
Dresdner Sprachsynthesesystem DRESS / microDRESS<br />
2004<br />
Prof. Dr. R. Hoffmann, Dr. H. Ding, Dipl.-Ing. O. Jokisch,<br />
Dr. U. Kordon, Dipl.-Ing. H. Kruschke, Dipl.-Ing. G. Strecha u. a.<br />
Hochwertiges Diphoninventar für die deutsche Sprachsynthese<br />
2002 – 2005<br />
Kooperation mit Prof. Dr. U. Hirschfeld, MLU Halle/Saale<br />
Prof. Dr. R. Hoffmann, Dipl.-Ing. O. Jokisch, Dr. H. Ding,<br />
Dipl.-Ing. M. Lachmann, Dipl.-Ing. D. Sobe<br />
Web-basierter Sprachserver<br />
2004<br />
Nachfolgearbeiten zum BMBF-Verb<strong>und</strong>projekt eL-IT (2001 – 2003)<br />
Dipl.-Ing. M. Eichner, Dipl.-Ing. D. Sobe, Dr.-Ing. M. Wolff<br />
Stimmaktivierung unter Nutzung prosodischer Merkmale<br />
2004<br />
Dipl.-Ing. M. Eichner, Dipl.-Wi.-Ing. M. Kühne, Dr.-Ing. M. Wolff<br />
Historische phonetische Geräte<br />
ab 2002<br />
Prof. Dr. D. Mehnert, Dr. R. Dietzel<br />
50
5 Veröffentlichungen<br />
Veröffentlichungen<br />
5.1 Bücher, Buchbeiträge<br />
[1] DELFS, J. <strong>und</strong> KÖLTZSCH, P. (Herausgeber): Vortragsband (CD/Webseite des DLR) zur<br />
Sitzung des DGLR-Fachausschusses T 2.3 „Strömungsakustik/Fluglärm“, 30.01.2004, DLR<br />
Braunschweig/TU <strong>Dresden</strong>.<br />
[2] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Sprachtechnologien in eL-IT: Einsatzszenarien<br />
<strong>und</strong> Umsetzung. In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen:<br />
Skaker Verlag 2004, ISBN 3-8322-2531-5, 111 – 120.<br />
[3] HOFFMANN, R.; KORDON, U.; KÜRBIS, S.; LACHMANN, M.: Signalverarbeitung <strong>und</strong> ihre<br />
Anwendung in der Akustik: Die Module „Signalverarbeitung“ <strong>und</strong> „Elektro- <strong>und</strong> Psychoakustik“.<br />
In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen: Shaker Verlag<br />
2004, ISBN 3-8322-2531-5, 69 – 78.<br />
[4] LESCHKA, S.; PFEIFER, G.: Ultraschallwandler mit PVDF-Folien - ein Berechnungsansatz<br />
mit Netzwerkmethoden. In: Schriftenreihe AHMT, XVII. Messtechnisches Symposium Freiburg<br />
2004. Shaker Verlag, Aachen 2004 ISBN: 3-8322-3190-0.<br />
[5] PETRICK, R.; HIRSCHFELD, D.; RICHTER, T. (VIC <strong>Dresden</strong>); HOFFMANN, R.: Verbkey – A<br />
single-chip speech control for the automobile environment. In: ABUT, H.; HANSEN, J. H. L.;<br />
TELEDA, K (Eds.), DSP for In-Vehicle and Mobile Systems. Springer eBook available at<br />
Kluwer Online, ISBN 0-387-22979-5.<br />
[6] SCHRÖDER, W. (Herausgeber): Fourth Aeroacoustics Workshop SWING (Simulation of wingflow<br />
noise generation). Co-organized by: RWTH Aachen – Aerodynamisches Institut / TU<br />
<strong>Dresden</strong> – Institut für Akustik <strong>und</strong> Sprachkommunikation (P. Költzsch, A. Zeibig). 26. – 27.<br />
Februar 2004, Aachen. Vortragsband Aachen/<strong>Dresden</strong> 2004, 154 Seiten.<br />
[7] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. <strong>Dresden</strong>: w.e.b. <strong>Universität</strong>sverlag<br />
2004 = Studientexte zur Sprachkommunikation; 32. ISBN 3-937672-71-0.<br />
5.2 Veröffentlichungen in Zeitschriften<br />
[8] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; KÜHNE, M.; WOLFF, M.:<br />
Speech-enabled services in a web-based e-learning environment. Advanced Technology for<br />
Learning 1 (2004) 2, 91 – 98.<br />
[9] FELDMANN, U.; BHATTACHARYA, J. (ÖAW Wien): Predictability improvement as an<br />
asymmetrical measure of interdependence in bivariate time series. International Journal of<br />
Bifurcation and Chaos 14 (2004) 2, 505 – 514.<br />
[10] HUEBELT, J.; KOSTMANN, C.; KOELTZSCH, P., STEPHANI, G.: Schallabsorber aus metallischen<br />
Hohlkugelstrukturen. In: Internationale Messe für Fertigungstechnik <strong>und</strong> Automatisierung,<br />
METAV München, 27.04. - 30.04.2004.<br />
[11] WERNER, S.; EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Towards spontaneous speech<br />
synthesis – Utilizing language model information in TTS. IEEE Trans. on Speech and Audio<br />
Processing 12 (2004) 4, 436 – 445.<br />
[12] ZEIBIG, A., BAUER, M.: Aerodynamische <strong>und</strong> aeroakustische Messungen am Windkanal zur<br />
Validierung numerischer Simulationen. Vortrag DGLR Fachausschusssitzung Strömungsakustik/Fluglärm,<br />
30.01.2004, DLR Braunschweig, Vortragsband, CD.<br />
5.3 TU-Informationen <strong>und</strong> Lehrmaterial<br />
[13] KORDON, U.: <strong>Technische</strong> Sprachkommunikation. Folienskript zur Vorlesung, TU <strong>Dresden</strong>,<br />
April 2004, 66 Seiten.<br />
[14] KORDON, U.: Sprachsynthese. Folienskript zur Vorlesung, TU <strong>Dresden</strong>, Oktober 2004, 50<br />
Seiten.<br />
[15] HOFFMANN, R.: Speech, Text, and Braille Conversion Technology. Preprint, TU <strong>Dresden</strong>,<br />
August 2004, 71 S.<br />
51
Veröffentlichungen<br />
5.4 Vortragsveröffentlichungen<br />
[16] BAUER, M.: Applicability of the SNGR model to compute Trailing Edge Noise. Proceedings of<br />
the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France, pp. 129 – 130.<br />
[17] BAUER, M.; ZEIBIG, A.: Applicability of the Modified von Kármán Spectrum to Predict<br />
Broadband Trailing Edge Noise. Tagungsband 14. DGLR/STAB Symposium, November 2004<br />
(Veröffentlichung durch den Springer Verlag im Jahr 2005 vorgesehen).<br />
[18] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P.: Modelling of combustion noise<br />
with the Bo<strong>und</strong>ary Element Method and Equivalent Source Method. Proceedings of Internoise<br />
2004, August 22– 25, Prague, Czech Republic 2004.<br />
[19] DING, H.; JOKISCH, O.: Grapheme-to-phoneme conversion in Mandarin Chinese text-tospeech.<br />
Proceedings of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg,<br />
France, 1151 – 1152.<br />
[20] DING, H.; JOKISCH, O.; HOFFMANN, R.: Glottalization in inventory construction: A crosslanguage<br />
study. Proc. Intern. Symposium on Chinese Spoken Language Processing<br />
(ISCSLP), December 15 – 18, Hong Kong, 37 – 40.<br />
[21] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; WOLFF, M.: Speech enabled<br />
services in a web-based e-learning environment. Proc. of the <strong>IAS</strong>TED International<br />
Conference on Web-Based Education, February 16 – 18, 2004, Innsbruck, Austria, 157 – 162.<br />
[22] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Voice characteristics conversion for TTS using<br />
reverse VTLN. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP),<br />
May 17 – 21, Montreal, Canada, I-17 – I-20.<br />
[23] EWERT, R.; BAUER, M.: Towards the Prediction of Trailing Edge Noise via Stochastic<br />
Surface Sources. AIAA-Paper 2004-2861, American Institute for Aeronautics and<br />
Astronautics, 2004.<br />
[24] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; HIRSCHFELD, D. (VIC <strong>Dresden</strong>): Advances<br />
in speech technology for embedded systems. Conference and Workshop on Assistive<br />
Technologies for Vision and Hearing Impairment (CVHI), June 29 – July 2, 2004, Granada,<br />
Spain, Abstracts p. 30 / Proceedings (CD-ROM).<br />
[25] HOFFMANN, R.; JOKISCH, O.; KORDON, U.; STRECHA, G.: Progress in scalable speech<br />
synthesis. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15,<br />
2004, Prague, 9 – 10.<br />
[26] HOFFMANN, R.; JOKISCH, O.; HIRSCHFELD, U. (MLU Halle); Anders, L. C. (MLU Halle):<br />
LexDRESS – Speech synthesis for a speaking pronunciation dictionary – First results. In:<br />
FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz,<br />
20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30,<br />
183 – 190.<br />
[27] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; VOLK, T.; HAIN, H.-U. (Siemens CT);<br />
FINGSCHEIDT, T.; AALBURG, S.; STAN, S. (Siemens ICM): Sprachsynthese mit minimiertem<br />
Footprint für Embedded-Anwendungen. VDE-Kongress „Innovationen für Menschen“, 18.<br />
– 20. Oktober 2004, Berlin, Band 1: Fachtagungsberichte der ITG / ETG. Berlin / Offenbach:<br />
VDE Verlag 2004, 187 – 192.<br />
[28] HOFFMANN, R.; MEHNERT, D.: Measuring pitch with historic phonetic devices. Proceedings<br />
of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg, France, 1147 – 1148.<br />
[29] HOFFMANN, R.; SHPILEWSKY, E. (Univ. Bialystok); LOBANOV, B. (Academy of Sciences<br />
Minsk); RONZHIN, A. (Inst. f. Informatics and Automation, St. Petersburg): Development of<br />
multi-voice and multi-language Text-to-Speech and Speech-to-Text conversion system<br />
(languages: Belorussian, Polish, Russian). Proc. of the 9 th Intern. Conf. “Speech and<br />
Computer” (SPECOM), Sep. 20 – 22, 2004, St. Petersburg, 657 – 661.<br />
[30] HOLSTEIN, P.; KOCH, M. (SINUS Messtechnik); HIRSCHFELD, D. (VIC <strong>Dresden</strong>);<br />
HOFFMANN, R.; BADER, D.; AUGSBURG, K. (TU Ilmenau): A strategy for signal recognition<br />
<strong>und</strong>er adverse conditions. Proc. Internoise, August 25 – 28, 2003, Jeju, Korea, N-111 [Nachtrag<br />
zu Jahresbericht 2003].<br />
52
Veröffentlichungen<br />
[31] HUEBELT, J.; ZEIBIG, A.; KOSTMANN, C.; STEPHANI, G.: Parameter of metallic hollow<br />
spheres - a porous so<strong>und</strong> absorbing material. Proceedings of 18 th International Congress on<br />
Acoustics, Japan, April 4 until 9 2004, Kyoto.<br />
[32] JOKISCH, O.; HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung für<br />
Sprachsynthese. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband<br />
der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation<br />
Bd. 30, 175 – 182.<br />
[33] JOKISCH, O.; HOFMANN, M.: Evolutionary optimization of an adaptive prosody model. Proc.<br />
8 th International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004),<br />
October 4 – 8, 2004, Jeju Island, Korea, TuC201p.18.<br />
[34] KNÖFEL, B. <strong>und</strong> SARRADJ, E.: Structure-borne So<strong>und</strong> in Automotive Structures: High<br />
Frequency Bo<strong>und</strong>ary Element Method (HFBEM) vs. Statistical Energy Analysis (SEA).<br />
Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg,<br />
France“, Vortragsband, CD, S.13-14.<br />
[35] KNÖFEL, B. <strong>und</strong> SARRADJ, E.: An Alternative Method To Compute High Frequency Structure<br />
Borne So<strong>und</strong> In Automotive Structures. Proceedings of the 11 th International Congress on<br />
So<strong>und</strong> and Vibration, July 05 - 08 2004, St. Petersburg, Russia, S. 3257-3264.<br />
[36] KÖLTZSCH, P. <strong>und</strong> V. BORMANN: Überlegungen zur Optimierung mit subjektiven Zielfunktionen<br />
(mit Beispielen aus der Akustik). Proceedings of the Joint Congress CFA/DAGA 2004,<br />
22. – 25. März 2004, Strasbourg, France.<br />
[37] KÖLTZSCH, P.; BAUER, M.; WITING, A.; ZEIBIG, A.; KETTLITZ, M. W.: Beitrag zur Modellierung<br />
von Strömungsschallquellen mit akustischen Elementarstrahlern. Vortrag, Deutscher<br />
Luft- <strong>und</strong> Raumfahrtkongress, <strong>Dresden</strong>, 2004, Kongressband + CD.<br />
[38] KÖLTZSCH, P.: Werner Albring <strong>und</strong> die Ähnlichkeitsmechanik. Vortrag zum Ehrenkolloquium<br />
anlässlich des 90. Geburtstages von Prof. em. Dr.-Ing. h.c. mult. Werner Albring, Berlin-<br />
Brandenburgische Akademie der Wissenschaften, 28. September 2004, Kolloquiumsband.<br />
[39] KÖLTZSCH, P.: Einführung in die Strömungsakustik. Vortrag zum Lehrgang „Strömungsinduzierter<br />
Lärm“, 12. - 14. Oktober 2004, <strong>Universität</strong> Erlangen-Nürnberg. Vortragsband S. 1 -19.<br />
[40] KÖLTZSCH, P.: <strong>Technische</strong> Akustik/Strömungsakustik – ausgewählte Gr<strong>und</strong>lagen. Vortrag<br />
zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen,<br />
23. – 24. November 2004, Vortragsmappe S. 1 – 18.<br />
[41] KÖLTZSCH, P.: Geräuscherzeugung durch Strömungen – Gr<strong>und</strong>lagen <strong>und</strong> Überblick. Vortrag<br />
zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen,<br />
23. – 24. November 2004, Vortragsmappe, S. 1 – 41.<br />
[42] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic<br />
features. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15, 2004,<br />
Prague, p. 11.<br />
[43] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic<br />
features. Proc. 8 th International Conference on Spoken Language Processing (ICSLP,<br />
INTERSPEECH 2004), October 4 – 8, 2004, Jeju Island, Korea, FrB202p.9.<br />
[44] KÜHNICKE, E.: GREEN’S functions for complex bo<strong>und</strong>ary conditons. Proc. of the 18th International<br />
Congress on Acoustics, April 4 – 9, Kyoto, Japan, pp. II-997 - II-982.<br />
[45] Putz, A.; Kühnicke, E.: Simulationsbasierte Optimierung eines Ultraschallmessverfahrens zur<br />
Bewertung der Montagequalität armierter Werkzeuge für die Kaltmassivumformung, DACH-<br />
Jahrestagung der DGZfP, Berichtsband 89-CD, Salzburg 17.-19. Mai 2004.<br />
[46] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop<br />
Speech Processing, September 13 – 15, 2004, Prague, p2 – 15.<br />
[47] PISCOYA, R., OCHMANN, M., BRICK, H., KÖLTZSCH, P.: Modelling of the combustion noise<br />
by means of the equivalent source method (ESM). Proceedings of the Joint Congress<br />
CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France.<br />
53
Veröffentlichungen<br />
[48] SARRADJ, E.; SCHULZE, C.; ZEIBIG, A.: Mikrofonarray mit Nahfeld-Beamforming. 6. Internationale<br />
Wissenschaftliche Konferenz „Saterra“, Tagungsband, 12. November 2004, HTW Mittweida.<br />
[49] SCHULZE, C.; ZEIBIG, A.; RICHTER, D.: Basic Investigations of Microphone Arrays.<br />
Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg,<br />
France.<br />
[50] SCHULZE, C.; SARRADJ, E.; ZEIBIG, A.: Characteristics of microphone arrays. Proceedings<br />
of Internoise 2004, August 22 – 25, Prague, Czech Republic.<br />
[51] SCHNELL, M.: Verstärkungslernen zur Prosodievorhersage in einem Sprachproduktionssystem.<br />
In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der<br />
15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation<br />
Bd. 30, 140 – 147.<br />
[52] SCHNELL, M.; HOFFMANN, R.: What concept-to-speech can gain for prosody. Proc. 8 th<br />
International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004),<br />
October 4 – 8, 2004, Jeju Island, Korea, FrA1402o.6.<br />
[53] SOBE, D.: Investigating capabilities and ergonomic properties of a speech controlled<br />
computer game. Proc. 14th Czech-German Workshop Speech Processing, September 13 –<br />
15, 2004, Prague, p. 16.<br />
[54] SOBE, D.; EICHNER, M.: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit<br />
<strong>und</strong> Ergonomie. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung.<br />
Tagungsband der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte<br />
zur Sprachkommunikation Bd. 30, 292 – 299.<br />
[55] STRECHA, G.; JOKISCH, O.; HOFFMANN, R.: A resource-saving modification of TD-PSOLA.<br />
Advances in Speech Technology. International Workshop, July 3 – 4, 2003, Maribor, 151 –<br />
155 [erschienen 2004].<br />
[56] STRECHA, G.: Neue Ansätze zur Sprachsynthese mit kodierten Sprachsegmenten. In:<br />
FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz,<br />
20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30,<br />
156 – 162.<br />
[57] TSCHÖPE, C.; HENTSCHEL, D. (FhG <strong>Dresden</strong>); WOLFF, M.; EICHNER, M.; HOFFMANN,<br />
R.: Classification of non-speech acoustic signals using structure models. Proc. IEEE Int. Conf.<br />
on Acoustics, Speech, and Signal Processing (ICASSP), May 17 – 21, Montreal, Canada, V-<br />
653 – V-656.<br />
[58] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Integrating speech enabled<br />
services in a web-based e-learning environment. Int. Conf. on Information Technology (ITCC),<br />
April 5 – 7, 2004, Las Vegas, USA, vol. 2, 303 – 307.<br />
[59] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Modeling pronunciation variation<br />
for spontaneous speech synthesis. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal<br />
Processing (ICASSP), May 17 – 21, Montreal, Canada, I-673 – I-676.<br />
[60] WOLFF, M.; KÜHNE, M.: Stimmaktivierung eines Spracherkenners. In: FELLBAUM, K.<br />
(Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz, 20. – 22.<br />
September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30, 69 – 78.<br />
[61] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Aeroacoustic<br />
Measurements and Validation Regarding Trailing Edge Noise. Proceedings of the 4 th<br />
Aeroacoustic Workshop in connection with the project SWING, February 26 – 27 2004,<br />
Aachen.<br />
[62] ZEIBIG, A.; SCHULZE, C.; HÜBELT, J.: Microphone array measurements for aeroacoustic<br />
investigations using a frequency band filtering method. Proceedings of the Joint Congress<br />
CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France.<br />
[63] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.:<br />
Aeroacoustic measurements for the validation of numerical simulations. Proceedings of the<br />
11 th International Congress on So<strong>und</strong> and Vibration, July 05 - 08 2004, St. Petersburg,<br />
Russia.<br />
54
Veröffentlichungen<br />
[64] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; HÜBELT, J.: Microphone array measurements for<br />
aeroacoustic source analysis. Proceedings of the 11 th International Congress on So<strong>und</strong> and<br />
Vibration, July 05 - 08 2004, St. Petersburg, Russia.<br />
[65] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; BAUER, M.: Validation of aeroacoustic numerical<br />
simulations with wind tunnel measurements. Proceedings of Internoise 2004, August 22 – 25,<br />
Prague, Czech Republic.<br />
[66] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ: Aeroakustische<br />
Messungen am Windkanal zur Validierung numerischer Simulationen. Vortrag, 6. Internationale<br />
Wissenschaftliche Konferenz SATERRA, 11.-16. November 2004 HTW Mittweida,<br />
Tagungsband.<br />
5.5 Vorträge (ungedruckt)<br />
[67] BAUER, M.: Überblick über Arbeiten mit dem SNGR-Modell (<strong>IAS</strong> & DLR). Vortrag bei Robert<br />
Bosch GmbH, 15.10.04, Stuttgart.<br />
[68] BAUER, M.: Berechnung von Umströmungsgeräuschen mit Hilfe eines synthetischen turbulenten<br />
Geschwindigkeitsfeldes, Vortrag beim Kolloquium der Akustiker des DLR, 22.10.04, TU<br />
Berlin.<br />
[69] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P: Berechnung von Verbrennungslärm<br />
mit der Bo<strong>und</strong>ary-Elemente- <strong>und</strong> der Ersatzstrahlermethode. 11. Workshop Physikalische<br />
Akustik, Bad Honnef, 17. September 2004 (erscheint demnächst in Acustica/Acta acustica).<br />
[70] DING. H.; JOKISCH, H.: An advanced American diphone inventory from the phonetic-acoustic<br />
viewpoint. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004, Maribor,<br />
Slovenia, Abstracts p. 25 – 26.<br />
[71] FELDMANN, U.: Design and synchronization of inverse systems. COST-277 Non-linear<br />
speech processing – MC meeting & seminar, April 15 – 16, 2004, Limerick, Ireland.<br />
[72] HOFFMANN, R.: Der Weg zur eingebetteten Sprachsynthese. <strong>Universität</strong> Trier, Phonetik-<br />
Workshop, 4. Juni 2004.<br />
[73] HOFFMANN, R.: Kommunikationsakustik. Vortrag im Rat der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik,<br />
21. Juli 2004.<br />
[74] HOFFMANN, R.: Technologische Fortschritte in der Spracherkennung <strong>und</strong> -synthese. T-<br />
Systems, Customer Care Center Circle für Versicherungen, 11. Oktober 2004, Leipzig.<br />
[75] HOFFMANN, R.: Vorstellung der Professur „Sprachkommunikation“. TU <strong>Dresden</strong>, Institut für<br />
Arbeits-, Organisations- <strong>und</strong> Sozialpsychologie, 22. November 2004.<br />
[76] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: State of the art in the project<br />
UASR (Unified approach for speech synthesis and recognition). 11 th Int. Workshop Advances<br />
in Speech Technology, July 7 – 9, 2004, Maribor, Slovenia, Abstracts p. 13 – 14.<br />
[77] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: Vorstellung der Professur<br />
„Sprachkommunikation“. Gemeinsame Präsentation mit VIC <strong>Dresden</strong>, München, 24.<br />
November 2004.<br />
[78] JOKISCH, O.; STRECHA, G.; DING, H.: Multilingual speaker selection for creating a speech<br />
synthesis database. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004,<br />
Maribor, Slovenia, Abstracts p. 17 – 18.<br />
[79] KNÖFEL, B: Ein alternatives Berechnungsverfahren zur Körperschallausbreitung in Fahrzeugstrukturen.<br />
Vortrag zum Institutskolloquium. 12. Mai 2004, Institut für Akustik <strong>und</strong><br />
Sprachkommunikation, TU <strong>Dresden</strong>.<br />
[80] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen.<br />
TU <strong>Dresden</strong>, Institut für Akustik <strong>und</strong> Sprachkommunikation, 7. April 2004.<br />
[81] KÖLTZSCH, P.: Fluglärm – Schallquellen, Belästigungen, Lärmminderung. Vorlesung im Studium<br />
Generale: Ringvorlesung „Interdisziplinäre Aspekte der Luft- <strong>und</strong> Raumfahrt – Das UZLR<br />
stellt sich vor (Universitäres Zentrum für Luft- <strong>und</strong> Raumfahrt)“, 2. November 2004.<br />
55
Veröffentlichungen<br />
[82] KÖLTZSCH, P.: Modelle zum Problemlösen – Lösungen zum Modellproblem. Akademievorlesung<br />
Sommersemester 2004. Berlin-Brandenburgische Akademie der Wissenschaften, Leibnizsaal,<br />
13. Mai 2004.<br />
[83] KÖLTZSCH, P. <strong>und</strong> V. BORMANN: Optimierung mit subjektiven Zielfunktionen. Vortrag zum<br />
3. Workshop der BBAW-Studiengruppe „Strukturbildung <strong>und</strong> Innovation: Transdisziplinäre Aspekte,<br />
Analyse <strong>und</strong> Optimierung“, 11. – 13. März 2004, Berlin.<br />
[84] MEHNERT, D.: Experimentalphonetik in Berlin. <strong>Universität</strong> Trier, Phonetik-Workshop, 4. Juni<br />
2004.<br />
[85] MEHNERT, D.; HOFFMANN, R.; DIETZEL, R.; KORDON, U.: Acoustic experiments with<br />
Wethlo’s larynx model. International Workshop in Phonetics Dedicated to the Memory of<br />
Farkas Kempelen, March 11 – 13, 2004, Budapest, Abstracts p. 31 – 32.<br />
[86] MIXDORFF, H. (TFH Berlin); JOKISCH, O.: Joint international bid for hosting SPEECH<br />
PROSODY in <strong>Dresden</strong>, Germany, in the Spring of 2006. Int. Conf. Speech Prosody, March 23<br />
– 26, Nara, Japan.<br />
[87] PISCOYA, R.: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern.<br />
Projekttreffen der Forschergruppe „Combustion Noise“, <strong>Universität</strong> Karlsruhe, Engler-<br />
Bunte-Institut, 04. Mai 2004.<br />
[88] PFEIFER, G.: Der Ultraschallstrahler als Richtlautsprecher, Theorie <strong>und</strong> Praxis der Demodulation<br />
in Luft. Öffentlicher Fachvortrag in FH Furtwangen 02.04.2004.<br />
[89] PISCOYA, R. <strong>und</strong> P. KÖLTZSCH: Verbrennungslärm. Vortrag zum Institutskolloquium. 30.<br />
Juni 2004, Institut für Akustik <strong>und</strong> Sprachkommunikation, TU.<br />
[90] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Validierungen<br />
zum aeroakustischen Quellmechanismus an Flugzeugtragflügeln. Vortrag zum Institutskolloquium.<br />
10. März 2004, Institut für Akustik <strong>und</strong> Sprachkommunikation, TU <strong>Dresden</strong>.<br />
5.6 Patente<br />
[91] HÜBELT, J.; KOSTMAN, C.; STEPHANI, G.; WAAG, U.; LOTZE, G.: Schallabsorber Patentnummer<br />
DE10347226, Anmelder: Fraunhofer-Gesellschaft zur Förderung der angewandten<br />
Forschung e. V, erteilt am 16.12.2004.<br />
[92] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: System zur ortssensitiven Wiedergabe<br />
von Audiosignalen. DE 103 20 274 A1, Offenlegungsschrift vom 9. 12. 2004.<br />
[93] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: Audiosignal-Erkennungssystem.<br />
DE 103 20 209 A1, Offenlegungsschrift vom 16. 12. 2004.<br />
5.7 Forschungsberichte<br />
[94] CUEVAS, M.: FSM Language Model Using Katz’ Back-Off Method. Forschungsbericht, TU<br />
<strong>Dresden</strong>, <strong>IAS</strong>, August 2004.<br />
[95] EICHNER, M.; WOLFF, M.: eL-IT – e-Learning-Module für Studiengänge der Informations-,<br />
Kommunikations- <strong>und</strong> Medientechnik. Abschlussbericht zum BMBF-Projekt 08NM136C. TU<br />
<strong>Dresden</strong>, <strong>IAS</strong>, März 2004.<br />
[96] JÄCKEL, R.: Lernsystem für das Training der deutschen Aussprache. Curicukum Phonetik<br />
Teil 1. Forschungsbericht im Kooperationsprojekt AzAR, TU <strong>Dresden</strong>, <strong>IAS</strong>, November 2004<br />
[97] KÖLTZSCH, P.: Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur<br />
lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln. Abschlussbericht zum Forschungsprojekt,<br />
gefördert durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-Stiftung. 11. Oktober<br />
2004.<br />
[98] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen.<br />
Forschungsbericht (Auftraggeber: Ges<strong>und</strong>heitstechnik Stier), TU <strong>Dresden</strong>, <strong>IAS</strong>, März<br />
2004.<br />
[99] PISCOYA, R.; BRICK, H.; OCHMANN, M.; KÖLTZSCH, P.: Modellierung der Schallabstrahlung<br />
von Flammen mit akustischen Ersatzstrahlern. Forschungsbericht der <strong>Technische</strong>n<br />
Fachhochschule Berlin/TU <strong>Dresden</strong> 2004.<br />
56
Veröffentlichungen<br />
Veröffentlichungen in Zeitungen <strong>und</strong> anderen Medien<br />
[100] HOFFMANN, R.: Pionier der technischen Sprachkommunikation verstorben. Dresdner <strong>Universität</strong>sjournal<br />
15 (2004) Nr. 13, S. 7.<br />
[101] REPKOW, F.: Forschung wider den Lärm. Ausgründung der TUD erforscht die Akustik.<br />
Dresdner <strong>Universität</strong>sjournal 15 (2004) Nr. 13, S. 8.<br />
[102] MAEDER, M. (Regie): Hugo Ball - Tenderenda der Phantast. Hörspielfassung mit synthetischen<br />
Stimmen [u. a. von DRESS]. Komposition <strong>und</strong> Produktion von Marc Matter, Marcus<br />
Maeder <strong>und</strong> Bernd Schurer. Schweizer Radio DRS 2, September 2004.<br />
[103] SCHMALFELDT, P.: Interesse auf der CeBIT. Dresdner <strong>Universität</strong>sjournal 15 (2004) Nr. 6, S.<br />
10.<br />
[104] N. N.: eL-IT – e-Learning-Module für Studiengänge der Informations-, Kommunikations- <strong>und</strong><br />
Medientechnik. Kursbuch eLearning 2004 – Produkte aus dem Förderprogramm. BMBF, Projektträger<br />
Neue Medien in der Bildung, 2004, S. 154 – 157.<br />
[105] N. N.: Forscher auf Abruf. Das Geschäftsmodell der TU <strong>Dresden</strong>. Deutschlandfunk,<br />
29.12.2004, Sendung „Campus <strong>und</strong> Karriere“ www.dradio.de/dlf/sendungen/campus/334665/<br />
[106] N.N.: Die Semperoper - Geschichten vom Wiederaufbau SACHSENSPIEGEL REPORTAGE:<br />
MDR regional, 29.12.2004, 20.15 Uhr,<br />
5.8 Messeteilnahmen<br />
CeBIT<br />
Exponate: Integrierte Sprachtechnologielösungen<br />
Webbasierte Sprachdienste<br />
Hannover, 18. – 24. März 2004<br />
Expo Science Europe (ESE 2004) – European Science Forum of the Youth<br />
Exponat: Integrierte Sprachtechnologielösungen <strong>und</strong> webbasierte Sprachdienstleistungen.<br />
<strong>Dresden</strong>, Kongresszentrum, 11. Juli 2004.<br />
57
Promotionen <strong>und</strong> Habilitationen<br />
6 Promotionen <strong>und</strong> Habilitationen<br />
am Institut für Akustik <strong>und</strong> Sprachkommunikation<br />
[1] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. Dissertation, TU <strong>Dresden</strong>,<br />
Fakultät Elektrotechnik <strong>und</strong> Informationstechnik. Gutachter: R. HOFFMANN (TU <strong>Dresden</strong>), G.<br />
RUSKE (TU München), K. FELLBAUM (BTU Cottbus). Tag der Verteidigung: 09.07.2004.<br />
[2] LESCHKA, STEPHAN: Entwurfsmethoden <strong>und</strong> Leistungsgrenzen elektromechanischer<br />
Schallquellen für Ultraschallanwendungen in Gasen im Frequenzbereich um 100 kHz<br />
Verteidigung: 30.07.2004, Gutachter: PROF. PFEIFER, PROF. SESSLER, PROF.<br />
WERTHSCHÜTZKY<br />
[3] HAIN, H.-U.: Phonetische Transkription für ein multilinguales Sprachsynthesesystem. Dissertation,<br />
TU <strong>Dresden</strong>, Fakultät Elektrotechnik <strong>und</strong> Informationstechnik. Gutachter: R.<br />
HOFFMANN (TU <strong>Dresden</strong>), W. ZÜHLKE (TU Ilmenau), H. HÖGE (UniBW München/Siemens<br />
AG). Tag der Verteidigung: 23.09.2004.<br />
externe Gutachtertätigkeit<br />
[4] BERTON, A.: Konfidenzmaße <strong>und</strong> deren Anwendung in der automatischen Sprachverarbeitung.<br />
Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen.<br />
Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung:<br />
5. 5. 2004.<br />
[5] HAMPICKE, M.: Optimierung von Smart-Home-Umgebungen für den Wohnbereich unter besonderer<br />
Berücksichtigung der elektronischen Sprachverarbeitung. Dissertation, BTU Cottbus,<br />
Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen. Gutachter: K.<br />
FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung: 5. 5. 2004.<br />
[6] HILARIO, J. M.: Discriminative connectionist approaches for automatic speech recognition in<br />
cars. Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen.<br />
Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung:<br />
31. 8. 2004.<br />
58
<strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong><br />
7 <strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong><br />
7.1 <strong>Diplom</strong>arbeiten<br />
[DA1] HIRSCH, STEFAN: Programm zum Praktikum „Digitale Filterung“ (Dipl.-Ing. S. Kürbis), verteidigt<br />
am 17.03.2004.<br />
[DA2] MEHNER, REINHARD: Körperschallübertragung von Sprache durch bau- <strong>und</strong> gebäudetechnische<br />
Strukturen in Wohn- <strong>und</strong> Industriebauten (Dr. Fuder/Dr. Joiko), verteidigt am<br />
07.04.2004.<br />
[DA3] KÜHNE, MARCO: Stimmaktivierung eines Spracherkenners (Dipl.-Ing. M. Wolff), verteidigt am<br />
28.04.2004.<br />
[DA4] SOBE, DANIEL: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit<br />
<strong>und</strong> Ergonomie (Dipl.-Ing. M. Eichner), verteidigt am 28.07.2004.<br />
[DA5] STARKE, ERIC: Vergleich von Tieffrequenz-Wiedergabesystemen nach dem Dipol- <strong>und</strong> Bassreflexprinzip<br />
(Prof. Pfeifer), verteidigt am 29.09.2004.<br />
[DA6] OTTO, BJÖRN MICHAEL: Inbetriebnahme eines Systems zur elektroakustischen Manipulation<br />
des Fahrzeuginnengeräuschs im Betrieb (Prof. Hoffmann, Dr. Hoffmann, DaimlerChrysler<br />
AG), verteidigt am 13.10.2004.<br />
[DA7] TRÖGE, JAN: Erarbeitung von Konzepten zur gezielten akustischen Abstimmung eines Motorlagers<br />
(Prof. Pfeifer,Dr. Hofmann;DaimlerCrysler AG), verteidigt am 13.10.2004.<br />
[DA8] SCHULZE, CHRISTIAN: Anwendung eines Mikrofonarrays zur Ortung von Schallquellen (DI<br />
Zeibig), verteidigt am 10.11.2004.<br />
[DA9] ACHILLES, STEFAN: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellen (DI<br />
Zeibig), verteidigt am 15.12.2004.<br />
[DA10] GARCIA VINAGRE, VICTOR: Generation of a Spanish Speech Database für a Text-to-<br />
Speech Synthesis System (Dipl.-Ing. Jokisch/<strong>Dresden</strong>), verteidigt im September 2004 Universidad<br />
de Valladolid (Spanien).<br />
[DA11] BERTOLA, VALERIO: Construction of an Italian and Spanish Diphone Data-Base for the<br />
DRESS Speech Synthesizer (Prof. Brofferio/Mailand; Dipl.-Ing. Jokisch/<strong>Dresden</strong>), verteidigt im<br />
Dezember 2004 Politecnico di Milano (Italien).<br />
7.2 <strong>Studienarbeiten</strong><br />
[SA1] SPARMANN, J.: Neubewertung von Umgebungsschall gemäß EU-Richtlinienentwurf KOM<br />
2000 (468) (Dr. Fuder), verteidigt am 30.06.2004.<br />
[SA2] KETTLITZ, M. W.: Messtechnische Untersuchung der Schallabstrahlung von Multipolen an<br />
einem Tragflügelmodell (DI Witing), verteidigt am 16.07.2004.<br />
[SA3] HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung (Dipl.-Ing.<br />
Jokisch), verteidigt am 08.09.2004.<br />
[SA4] GEYER, T.: Softwarekomponenten zur digitalen Signalverarbeitung mit DSP zur<br />
Vergrößerung des Dynamikumfanges herkömmlicher ADC/DAC (Dipl.-Ing. S. Kürbis, Dipl.-Ing.<br />
D. Richter), verteidigt am 08.09.2004.<br />
[SA5] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen (Dipl.-Ing. M. Cuevas),<br />
verteidigt am 08.09.2004.<br />
[SA6] GUST, N.: Zerstörungsfreie Verbindungsprüfung bei Schichtdicken im µm-Bereich mit Hilfe<br />
von Ultraschall (DI Richter), verteidigt am 03.11.2004.<br />
[SA7] PETER, A.: Subjektive <strong>und</strong> objektive Kriterien für die akustische Qualität eines Raumes (Dr.<br />
Bormann), verteidigt am 10.11.2004.<br />
[SA8] GIESLER, J.: Modellbildung <strong>und</strong> Sensitivitätsanalyse des Schwingungsverhaltens einer Kastenstruktur<br />
bei hohen Frequenzen (DI Knöfel), verteidigt am 01.12.2004.<br />
[SA9] LÖSCHKE, H.: Minimierung der Lärmstörungen in einem Großraumbüro (Dr. Fuder), verteidigt<br />
am 01.12.2004.<br />
[SA10] LIPPMANN, M.: Untersuchungen von Hohlspiegeln mit Mehrmikrofonanlagen (DI Zeibig),<br />
verteidigt am 15.12.2004.<br />
59
Wissenschaftliche Veranstaltungen<br />
8 Wissenschaftliche Veranstaltungen<br />
8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem<br />
Lothar-Cremer-Preis der Deutschen Gesellschaft für Akustik<br />
im Jahre 2004<br />
Herr Dr. Ennes Sarradj, Jahrgang 1969, gehört zu den kompetentesten Nachwuchswissenschaftlern<br />
auf dem Gebiet der <strong>Technische</strong>n Akustik in Deutschland. Mit dem frühzeitigen Start seiner wissenschaftlichen<br />
Laufbahn (Promotion mit 29 Jahren) hat Herr Sarradj gegenwärtig bereits beeindruckende<br />
Forschungsergebnisse in der Akustik <strong>und</strong> überzeugende Aktivitäten in der Wissenschaftsorganisation<br />
vorzuweisen, insbesondere auf den Fachgebieten:<br />
• Statistische Energieanalyse <strong>und</strong> Körperschall<br />
• numerische Akustik (insbesondere BEM)<br />
• Schallabsorber, Messtechnik<br />
• Gehschall.<br />
Sein Hauptarbeitsgebiet ist das Verfahren der Statistischen Energieanalyse (SEA). Dieses Verfahren<br />
dient zur Untersuchung <strong>und</strong> Vorhersage des vibroakustischen Verhaltens komplexer, zusammengesetzter<br />
Strukturen (z. B. Maschinen, Bauwerke) bei hohen Frequenzen. Herr Dr. Sarradj hat dieses<br />
Verfahren um wertvolle wissenschaftliche <strong>und</strong> anwendungsorientierte Aspekte bereichert. Zur breiten<br />
Anwendung des Verfahrens <strong>und</strong> für einen einfachen Einstieg in die SEA hat Herr Sarradj im Internet<br />
eine kostenlose Software „FreeSEA“ zur Verfügung gestellt. Dabei soll durch einfache Beispiele, wie<br />
zur Schalltransmission zwischen benachbarten Räumen oder zur Körperschallanregung einer Karosserie,<br />
der „Einstieg in die Welt der SEA“ erleichtert werden. Dieses Programm wurde in den letzten<br />
drei Jahren weltweit von 2500 Interessenten heruntergeladen.<br />
Dr. Sarradj war Mitglied im – mittlerweile ausgelaufenen – thematischen EU-Netzwerk SEANET, an<br />
dem die TU <strong>Dresden</strong> als einzige deutsche <strong>Universität</strong> beteiligt war. Das Projekt vereinte 28 Partner<br />
aus 11 Ländern der EU, <strong>und</strong> zwar aus 7 Industrieunternehmen, 12 <strong>Universität</strong>en <strong>und</strong> 9 Forschungseinrichtungen.<br />
Ziele des Netzwerkes waren die Bündelung der Forschung zum Thema SEA, die Anwendung<br />
dieses Verfahrens <strong>und</strong> die Schaffung einer allgemeinen Methodenlehre. Dr. Sarradj hat sich<br />
außerordentlich aktiv an den Aufgaben dieses EU-Netzwerkes beteiligt.<br />
Ein zweites wichtiges Arbeitsgebiet von Dr. Sarradj ist das Gebiet des Gehschalls. Im Unterschied zu<br />
dem bekannten <strong>und</strong> genormten Begriff Trittschall wird mit der Bezeichnung Gehschall der Lärm charakterisiert,<br />
der durch das Begehen eines Fußbodens im begangenen Raum entsteht. Diese Problematik<br />
hat durch den verstärkten Einsatz von harten <strong>und</strong> damit lauten Bodenbelägen, wie z. B. den<br />
Laminat-Fußböden, an Bedeutung gewonnen.<br />
Als Beitrag von Dr. Sarradj kann die erstmalige Behandlung dieses Phänomens gelten, für das dieser<br />
neue Begriff „Gehschall“ mit einem DAGA-Vortrag 2000 eingeführt wurde. Er hat die physikalischen<br />
Entstehungsmechanismen des Gehschalls untersucht, er hat ein Prüfverfahren entwickelt, das die<br />
Einschätzung der akustischen Qualität von Fußböden hinsichtlich des Gehschalls ermöglicht, er hat<br />
sich insbesondere auch um die messtechnische Charakterisierung von Gehschall sehr verdient gemacht.<br />
Ein weiteres, langjähriges Arbeitsgebiet von Herrn E. Sarradj ist das Gebiet der Schallabsorber verschiedenartigster<br />
Ausführungen: Faserabsorber, Schaumstoffe, offenporige Asphalte <strong>und</strong> Betone,<br />
Granulate <strong>und</strong> Metallfasern. Dabei besteht sein wissenschaftlicher Beitrag (insbesondere im Zusammenhang<br />
mit porösen Fahrbahnoberflächen)<br />
- im Einsatz phänomenologischer, empirischer <strong>und</strong> mikrostruktureller Theorien zur Gewinnung von<br />
Absorberkennwerten aus den Parametern Strömungswiderstand, Tortuosität <strong>und</strong> Porosität,<br />
- in der Entwicklung <strong>und</strong> Validierung von Theorien zur Vorhersage der akustisch relevanten Parameter<br />
aus den technologischen Parametern des zur Fahrbahnherstellung eingesetzten Mischgutes<br />
(Korngrößenverteilung, Bindemittelanteil, Kornform),<br />
- in der Entwicklung eines Mehrbereich-Randelementeverfahrens zur Berechnung des Schallfeldes<br />
in der Umgebung von Absorbern.<br />
Dr. Sarradj gehört zum kleinen Kreis technischer Akustiker, die über das Know-how der Messverfahren<br />
zur Tortuosität <strong>und</strong> zu den Absorberkennwerten (Wellenwiderstand <strong>und</strong> Ausbreitungskonstante)<br />
auf der Gr<strong>und</strong>lage eigener wissenschaftlicher Arbeiten verfügen.<br />
60
Wissenschaftliche Veranstaltungen<br />
Im Zusammenhang mit den Schallabsorbern hat Herr Dr. Sarradj große Anteile an dem Forschungsprojekt<br />
„Einfluss der Fahrbahneigenschaften auf das Rollgeräusch von Kraftfahrzeugen“, das von der<br />
Deutschen Forschungsgemeinschaft finanziert worden ist. Dieses Projekt wurde gemeinsam vom<br />
Fachgebiet "<strong>Technische</strong> Akustik" <strong>und</strong> dem Fachgebiet "Straßenbau" der Fakultät Bauingenieurwesen<br />
bearbeitet. Die Ergebnisse liefern die Gr<strong>und</strong>lage für eine systematische <strong>und</strong> gezielte akustische Optimierung<br />
von ein- oder mehrschichtigen Fahrbahnaufbauten.<br />
Herr Dr. Sarradj hat sich in hohem Maße in der Lehre der <strong>Technische</strong>n Akustik betätigt. Er hat eine<br />
eigene Vorlesung mit dem Titel „Numerische Akustik“ aufgebaut, in der die in der Akustik verwendeten<br />
numerischen Verfahren behandelt <strong>und</strong> an Beispielen, in einer Projektarbeit <strong>und</strong> mit Verwendung handelsüblicher<br />
Softwarepakete, erprobt wurden. Dr. Sarradj war im Rahmen einer Vorlesungsreihe mit<br />
Vorlesungen zur Bauakustik, zur Lärmabwehr <strong>und</strong> zur Immissionsprognose beteiligt.<br />
Herr Sarradj hat hervorragende Organisationsfähigkeiten nachgewiesen. Bei der Einwerbung von<br />
Drittmitteln nahm er hinsichtlich selbständiger Kontaktanbahnung, Verhandlungsführung <strong>und</strong> Vertragsabschluss<br />
eine Spitzenstellung an der Fakultät ein. Dabei zeigte er ein übergewöhnliches Maß<br />
der Praxis des Managements <strong>und</strong> der Übernahme von Verantwortung, des Weiteren den Blick für den<br />
notwendigen Aufwand <strong>und</strong>, nicht unwesentlich, die erforderliche Korrektheit in den formalen Details. In<br />
der Logik dieser Fähigkeiten liegt seine gegenwärtige Tätigkeit: Dr. Sarradj ist seit Oktober 2002 ist<br />
Geschäftsführer der Gesellschaft für Akustikforschung <strong>Dresden</strong> mbH, einer stark wissenschaftlich<br />
orientierten Ausgründung aus dem akustischen Institut der TU <strong>Dresden</strong>.<br />
Durch seine hohe Fachkompetenz, seine fre<strong>und</strong>liche <strong>und</strong> hilfsbereite Art sowie durch sein „Stehvermögen“<br />
im wissenschaftlichen Streitgespräch werden die Zusammenarbeit mit ihm <strong>und</strong> die Mitarbeit<br />
unter seiner Leitung von Kollegen <strong>und</strong> Mitarbeitern als großer Gewinn empf<strong>und</strong>en.<br />
In der Referenz eines Fachkollegen heißt es:<br />
„Dr. Sarradj gehört für mich zu dem immer seltener werdenden Nachwuchs, der für theoretische Arbeiten<br />
in seinem Fach großes Interesse hat, gleichzeitig aber auch die ausgezeichnete Fähigkeit besitzt,<br />
sein theoretisches Wissen in praktischen Anwendungen umzusetzen.“<br />
Und ein anderer Gutachter schreibt:<br />
„Von Herrn Sarradj habe ich Vorträge gehört (ICSV Stockholm, ICA Rom), die mich durch ihre didaktische<br />
<strong>und</strong> wissenschaftliche Qualität sehr beeindruckt haben...“<br />
(P. Költzsch)<br />
8.2 Konferenz „Elektronische Sprachsignalverarbeitung“,<br />
Cottbus, 20. bis 22. September 2004<br />
Mit Herrn Professor Klaus Fellbaum von der Brandenburgischen TU Cottbus hatte wieder einmal einer<br />
der Mitbegründer unserer gemeinsamen Veranstaltungsreihe die Verantwortung für die Durchführung.<br />
Die Konferenz fand schon zum dritten Mal (nach 1997 <strong>und</strong> 2000) in dem sehr zweckmäßigen Hörsaalgebäude<br />
der BTU Cottbus statt. Insgesamt wurden 37 Vorträge <strong>und</strong> Poster in den Vortragsgruppen<br />
• Spracherkennung,<br />
• Sprachsynthese,<br />
• Akustik <strong>und</strong> Signalverarbeitung,<br />
• Technologie <strong>und</strong> Anwendung der Aprachsignalverarbeitung<br />
präsentiert. Als Besonderheit (gewissermaßen als Blick in die nahe Zukunft) wurde der Themenkomplex<br />
Mobile Computing, Ubiquitous Computing and Ambient Intelligence aufgenommen <strong>und</strong> durch die<br />
folgenden Hauptvorträge zur Diskussion gestellt:<br />
• P. Noll, TU Berlin: Sensing People – Localization with Microphone Arrays<br />
• C. Hentschel, BTU Cottbus: Ambient Intelligence – Vision <strong>und</strong> technische Lösungsansätze<br />
• A. Ullsperger, BTU Cottbus: Schlüsselinnovationen, Pilotprodukte <strong>und</strong> Thesen für Sprachverarbeitung<br />
bei Wearable Computing<br />
Der Tagungsband ist als Band 30 der „Studientexte zur Sprachkommunikation“ in der gewohnten<br />
Weise erschienen.<br />
61
Wissenschaftliche Veranstaltungen<br />
8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“ am<br />
8. Dezember 2004<br />
Die Elektrotechnischen Kolloquien werden vom VDE-Bezirksverein <strong>Dresden</strong> veranstaltet. Wir nehmen<br />
das 469. Kolloquium in diesen Jahresbericht auf, weil es im Zusammenhang mit der Wiederbesetzung<br />
unserer Akustikprofessur unter der modifizierten Widmung „Kommunikationsakustik“ dazu beitrug, das<br />
Verständnis für das wissenschaftliche Anliegen dieses Fachgebietes zu vertiefen. Der Referent, Herr<br />
Prof. Dr.-Ing. Dr. techn. h. c. Jens Blauert (Ruhr-<strong>Universität</strong> Bochum), kann als Pionier der Kommunikationsakustik<br />
auf einen überreichen F<strong>und</strong>us an Arbeiten zurückgreifen, die von ihm <strong>und</strong> seinen Mitarbeitern<br />
auf diesem Gebiet durchgeführt wurden. Er stellte daraus einen sehr informativen <strong>und</strong> anregenden<br />
Übersichtsvortrag zusammen.<br />
Um einen Eindruck vom Inhalt zu geben, drucken wir nachstehend die Abbildung <strong>und</strong> den Text ab, die<br />
der Autor für die Einladung zum Kolloquium zur Verfügung gestellt hatte:<br />
62<br />
Those aspects of acoustics which concern<br />
the relations of acoustics to the information<br />
and communication technologies are now<br />
frequently called “communication<br />
acoustics”. After a short review of the<br />
history of this field, relevant results from<br />
recent research at the Institute of<br />
Communication Acoustics at the Ruhr-<br />
University of Bochum, Germany, will be<br />
reported. This work can be seen in the light<br />
of the research areas of Computational<br />
Auditory Scene Analysis (CASA) and<br />
Auditory Virtual Environments (AVE) - both<br />
dealing with the parametric representation<br />
of auditory scenes. Recent application<br />
opportunities and future trends will be<br />
discussed. It will be argued that modern<br />
communication-acoustical systems – which<br />
are often only embedded components in<br />
more complex communication systems -<br />
require more and more built-in explicit<br />
knowledge. Among other things, the<br />
development of such components and<br />
systems calls for data and knowledge from<br />
the cognitive sciences.
Wissenschaftliche Veranstaltungen<br />
8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“<br />
Seit Dezember 2003 wird das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung<br />
technischer Prozesse“ gemeinsam mit der FhG EADQ <strong>Dresden</strong> bearbeitet. Am 8. Dezember<br />
2004 fand dazu am Institut für Akustik <strong>und</strong> Sprachkommunikation der TU <strong>Dresden</strong> das 1. Statusseminar<br />
statt.<br />
Im Rahmen des Seminars wurden folgende Vorträge gehalten:<br />
1. Prof. R. Hoffmann: Einführung<br />
2. Dr. Hentschel (FhG EADQ): Ausgewählte Aspekte des akustischen Monitoring<br />
3. Dr. M. Wolff: Training <strong>und</strong> Erkennung<br />
4. C. Tschöpe (FhG EADQ): Experimente <strong>und</strong> bisherige Ergebnisse<br />
5. S. Werner: Aktueller Stand des DFG-Projekts<br />
Das Seminar zeigtenach nunmehr einem Jahr Projektlaufzeit, dass sich die Idee der Übertragung von<br />
Algorithmen, die sich in der Spracherkennung bewährt haben, auf allgemeinere Probleme der Prozessanalyse<br />
als tragfähig erwiesen hat. Insbesondere sind dabei die Algorithmen des Strukturlernens<br />
zu nennen, die zuletzt in der Dissertation von M. Wolff zusammengefasst wurden. Auf dieser Basis<br />
wurden die folgenden Aufgaben im Rahmen des DFG-Projektes präzisiert.<br />
9 Institutskolloquien<br />
14.01.2004<br />
11.02.2004<br />
25.02.2004<br />
10.03.2004<br />
07.04.2004<br />
12.05.2004<br />
16.06.2004<br />
30.06.2004<br />
14.07.2004<br />
Fuder, G./Bormann, V.:<br />
Gesichtspunkte der Grenzwertfestlegung zur Vermeidung von Gehörschäden<br />
Ding, H.:<br />
Graphem-Phonem-Umsetzung im Chinesischen<br />
Hübelt, J.:<br />
Schallabsorber (poröse Hohlkugeln) FhG-Projekt<br />
Bauer, M./Zeibig, A., Költzsch, P.:<br />
Abschluss SWING/SWING + DFG-Verb<strong>und</strong>projekt Aeroakustik<br />
Leschka, St.:<br />
Verfahren <strong>und</strong> Grenzen bei der Erzeugung von Ultraschall in Luft<br />
Knöfel, B.:<br />
Akustische Simulationsverfahren (Körperschall)<br />
Kühnicke, E.:<br />
Aktuelle Entwicklungen aus dem Bereich des Ultraschalls<br />
Folprecht, St..<br />
Messfehleranalyseverfahren im Vergleich<br />
Brick, H., Piscoya, R., Ochmann, M., Költzsch, P.:<br />
Verbrennungslärm (DFG-Forschergruppe)<br />
63
10 Reisen<br />
Prof. Hoffmann<br />
Dipl.-Ing. Jokisch<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Reisen<br />
Beratung zum Projekt lexDRESS<br />
Martin-Luther-<strong>Universität</strong> Halle<br />
Ehrenkolloquium Prof. Lacroix<br />
Goethe-<strong>Universität</strong> Frankfurt/Main<br />
12.01.2004<br />
16.01.2004<br />
Dipl.-Ing. Zeibig DGLR-FA-Sitzung „Fluglärm“ 30.01.2004<br />
Prof. Pfeifer Statuskolloquium Mikrosystemtechnik<br />
Karlsruhe<br />
Prof. Hoffmann BMBF-Gutachter-Informationsveranstaltung zum<br />
Programm FH³, Fachhochschule Düsseldorf<br />
Dipl.-Ing.Eichner <strong>IAS</strong>TED International Conference on Web-Based<br />
Education, Innsbruck<br />
Prof. Hoffmann Erweiterte Vorstandssitzung der ITG<br />
München<br />
Dr.-Ing. Fuder Sitzung NALS/NATG A1<br />
Berlin<br />
Prof. Hoffmann<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Lachmann<br />
Dipl.-Ing. Strecha<br />
Arbeitstreffen VRDG SIEMENS<br />
Preparatory Meeting ECESS<br />
München<br />
Prof. Költzsch Sitzung Klasse Technikwissenschaften, Rat der Akademie<br />
(BBAW)<br />
Berlin<br />
Prof. Költzsch<br />
Dipl.-Ing. Bauer<br />
Dipl.-Ing. Zeibig<br />
SWING-Workshop<br />
Aachen<br />
Dr.-Ing. Piscoya Projekttreffen Forschergruppe „Verbrennungslärm“<br />
Karlsruhe<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Prof. Költzsch<br />
Dr.-Ing. Bormann<br />
Dr.-Ing. Fuder 24. Sitzung des NVT 5<br />
Bremen<br />
Dipl.-Ing. Jokisch<br />
MSc. Oba<br />
D. Sobe<br />
64<br />
International Workshop in Phonetics Dedicated to the<br />
Memory of Farkas Kempelen<br />
Hungarian Academy of Sciences, Budapest<br />
09.02. - 11.02.2004<br />
11.02.2004<br />
15.02. - 19.02.2004<br />
17.02.2004<br />
19.02.2004<br />
19.02. - 20.02.2004<br />
19.02. -20.02.2004<br />
25.02. - 29.02.2004<br />
04.03. - 05.03.2004<br />
11.03. - 13.03.2004<br />
3. Workshop „Strukturbildung <strong>und</strong> Innovation“ 11.03. - 13.03.2004<br />
CeBIT<br />
Hannover<br />
11.03. - 14.03.2004<br />
18.03. - 21.03.2004<br />
18.03. - 23.03.2004<br />
20.03. - 24.03.2004
Prof. Hoffmann<br />
Prof. Költzsch<br />
Prof. Mehnert<br />
Dipl.-Ing. Bauer<br />
Dr.-Ing. Bormann<br />
Dr. Ding<br />
Dipl.-Ing. Knöfel<br />
Ch. Schulze<br />
Dipl.-Ing. Zeibig<br />
Reisen<br />
Gemeinschaftstagung<br />
7ème Congrès Français d’Acoustique (CFA) /<br />
30. Deutsche Jahrestagung für Akustik (DAGA)<br />
Strassburg (Frankreich)<br />
Dipl.-Ing. Jokisch International Conference Speech Prosody 2004<br />
Nara (Japan)<br />
Dipl.-Ing. Jokisch International Symposium on Tonal Aspects of<br />
Languages (TAL 2004)<br />
Beijing (China)<br />
Dipl.-Ing. Werner International Conference on Information Technology<br />
(ITCC)<br />
Las Vegas (USA)<br />
Prof. Költzsch 44. Sitzung AK (Umweltb<strong>und</strong>esamt)<br />
Berlin<br />
Prof. Pfeifer Vortragsreihe Audiobeam<br />
Villingen-Schwenningen<br />
Dipl.-Ing. Hübelt Vortrag ICA Kyoto<br />
Kyoto (Japan)<br />
Dr.-Ing. Feldmann COST 277 (Nonlinear Speech Processing)<br />
Management Committee Meeting & Seminar<br />
Limerick (Irland)<br />
Prof. Költzsch<br />
S. Achilles<br />
Dipl.-Ing. Zeibig<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Strecha<br />
Projektberatung<br />
Braunschweig<br />
Themenverteidigung VRDG SIEMENS<br />
München<br />
Prof. Hoffmann Kolloquium Kommunikationsakustik<br />
Ruhr-<strong>Universität</strong> Bochum<br />
Prof. Költzsch Projektberatung Verbrennungslärm<br />
TFH Berlin<br />
Prof. Hoffmann Zukunft durch Informationstechnik<br />
Jubiläumsfachtagung 50 Jahre ITG<br />
Frankfurt/Main<br />
22.03. - 25.03.2004<br />
23.03. - 26.03.2004<br />
28.03. - 30.03.2004<br />
05.04. - 07.04.2004<br />
31.03.2004<br />
01.04. - 03.04.2004<br />
03.04. - 12.04.2004<br />
15.04. - 16.04.2004<br />
15.04.2004<br />
19.04.2004<br />
23.04.2004<br />
22.04. - 23.04.2004<br />
26.04. - 27.04.2004<br />
Dipl.-Ing. Hübelt Vortrag MEATV München 28.04.2004<br />
Prof. Hoffmann Festkolloquium zum 60. Geburtstag<br />
Prof. Fastl <strong>und</strong> Prof. Ruske<br />
TU München<br />
Prof. Hoffmann Verteidigung der Dissertationen Berton <strong>und</strong> Hampicke<br />
Brandenburgische TU Cottbus<br />
Doz. Dr. Kühnicke Vortrag zerstörungsfreie Prüfung<br />
Salzburg<br />
30.04.2004<br />
05.05.2004<br />
15.05. - 20.05.2004<br />
65
Prof. Hoffmann<br />
Dipl.-Ing. Eichner<br />
Dipl.-Inf. Tschöpe<br />
Dipl.-Ing. Werner<br />
Dipl.-Ing. Wolff<br />
Reisen<br />
IEEE International Conference on Acoustics, Speech,<br />
and Signal Processing (ICASSP)<br />
Montreal (Kanada)<br />
Dr.-Ing. Kordon Projektbesprechung mit Institut für Musik-<br />
instrumentenbau Zwota <strong>und</strong> Projektträger BMBF<br />
Markneukirchen<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Arbeitsbesuche T-Systems /Prof. Endres /Prof. Wolf<br />
TU Darmstadt / <strong>Universität</strong> Frankfurt<br />
Phonetik-Workshop (Prof. Köster)<br />
<strong>Universität</strong> Trier<br />
Prof. Hoffmann Verteidigung Habilitationsschrift Dr. Hollmach /<br />
Dissertation Ulbrich<br />
Martin-Luther-<strong>Universität</strong> Halle (Saale)<br />
Dipl.-Ing. Jokisch Kooperationsworkshop T-Systems / TU <strong>Dresden</strong><br />
<strong>Dresden</strong><br />
Dr.- Ing. Kordon Projektvorbereitung Musicon Valley<br />
Markneukirchen<br />
Dr.-Ing. Fuder 25. Sitzung NVT 5<br />
Halle/Saale<br />
Prof. Hoffmann Conference and Workshop on Assistive Technologies<br />
for Vision and Hearing Impairment (CVHI 2004)<br />
Granada (Spanien)<br />
Dipl.-Ing. Jokisch Netzwerkseminar der Stiftung Industrieforschung<br />
Hamburg<br />
Dipl.-Ing. Knöfel<br />
Dipl.-Ing. Zeibig<br />
Prof. Hoffmann<br />
Dr. Ding<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Strecha<br />
Dr.-Ing. Piscoya<br />
Dipl.-Ing. Richter<br />
Tagung IC SV 11<br />
St. Petersburg<br />
11th International Workshop Advances in Speech<br />
Technology (AST ‘04)<br />
ECESS Meeting (European Center of Excellence in<br />
Speech Synthesis)<br />
University of Maribor (Slowenien)<br />
Messungen<br />
TU Darmstadt<br />
17.05. - 21.05.2004<br />
25.05.2004<br />
03.06.2004<br />
04.06.2004<br />
17.06.2004<br />
22.06.2004<br />
22.06.2004<br />
23.06. - 24.06.2004<br />
29.06. - 02.07.2004<br />
01.07. - 03.07.2004<br />
05.07. - 09.07.2004<br />
06. 07.- 08.07.2004<br />
14.07. - 16.07.2004<br />
Prof. Pfeifer Wedemark 28.07. - 29.07.2004<br />
Dr.-Ing. Piscoya Mitarbeitertreffen<br />
Aachen<br />
Prof. Hoffmann<br />
Dr.-Ing. Kordon<br />
Dipl.-Ing. Knöfel<br />
Ch.Schulze<br />
Dipl.-Ing. Zeibig<br />
66<br />
Projektbesprechung mit Institut für Musik-<br />
instrumentenbau Zwota <strong>und</strong> Projektträger BMBF<br />
Markneukirchen<br />
Konferenz Internoise 2004<br />
Prag (Tschechien)<br />
29.07. - 30.07.2004<br />
04.08.04<br />
22.08. - 25.08.2004
Reisen<br />
Prof. Hoffmann Verteidigung Dissertation Hilario<br />
Brandenburgische TU Cottbus<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Strecha<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Arbeitstreffen VRDG SIEMENS<br />
München<br />
Historisch-Phonetische Sammlung<br />
<strong>Universität</strong> Hamburg<br />
Dr.-Ing. Feldmann COST 277-Meeting / International Summer Scholl<br />
„Nonlinear Speech Processing“<br />
Vietri sul Mare (Italien)<br />
Prof. Hoffmann<br />
Dipl.-Ing. Eichner<br />
Dr.-Ing. Kordon<br />
Dipl.-Ing. Kortke<br />
MSc. Oba<br />
Dipl.-Ing. Sobe<br />
Dr.-Ing. Wolff<br />
14th Czech-German Workshop “Speech Processing”<br />
Prag (Tschechien)<br />
Prof. Hoffmann Konferenz „Verarbeitung natürlicher Sprache“<br />
(KONVENS), Wien<br />
Prof. Költzsch Projekttreffen Verbrennungslärm/Workshop<br />
Bad Honeff<br />
Dipl.-Ing. Brick 11. Workshop „Physikalische Akustik“<br />
Bad Honeff<br />
Prof. Költzsch DLR-Kongress<br />
<strong>Dresden</strong><br />
Prof. Hoffmann<br />
Dr.-Ing. Kordon<br />
Prof. Hoffmann<br />
Prof. Mehnert<br />
Dipl.-Ing. Eichner<br />
M. Hofmann<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Sobe<br />
Dipl.-Ing. Strecha<br />
Dr.-Ing. Wolff<br />
Dipl.-Ing. Zeibig<br />
M. Lippmann<br />
Sitzung der ITG-Fachgruppen 4.3 <strong>und</strong> 4.4<br />
Brandenburgische TU Cottbus<br />
Konferenz „Elektronische Sprachsignalverarbeitung“<br />
Brandenburgische TU Cottbus<br />
Abholung akustischer Hohlspiegel<br />
Lampertswalde<br />
Prof. Költzsch Ehrenkolloquium Prof. Obermeier<br />
Freiberg<br />
Dipl.-Ing. Bauer Teilnahme an Überflugmessungen<br />
Flughafen Coschstedt<br />
Prof. Hoffmann<br />
Dipl.-Ing. Eichner<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Kühne<br />
International Conference on Spoken Language<br />
Processing (ICSLP – INTERSPEECH)<br />
Jeju (Korea)<br />
25.08.2004<br />
26.08.2004<br />
06.09. - 07.09.2004<br />
13.09. - 18.09.2004<br />
13.09. - 15.09.2004<br />
14.09. - 17.09.2004<br />
15.09. - 18.09.2004<br />
16.09. - 18.09.2004<br />
20.09. - 21.09.2004<br />
20.09.2004<br />
20.09. - 22.09.2004<br />
24.09.2004<br />
24.09.2004<br />
30.09./02.10./03.10.<br />
04.10. - 08.10.2004<br />
67
Reisen<br />
Prof. Pfeifer XVIII. Messtechnisches Symposium<br />
Freiburg<br />
Prof. Hoffmann Vortrag für T-Systems,<br />
Customer Care Center Circle für Versicherungen<br />
Leipzig<br />
Prof. Költzsch Lehrgang „Stömungsindizierter Lärm“<br />
Erlangen<br />
Dipl.-Ing. Zeibig Vortrag Konferenz „Saterra“<br />
Mittweida<br />
Dipl.-Ing. Bauer Disk. akt. Forschungsaufgaben (R. Bosch GmbH)<br />
Stuttgart<br />
Dipl.-Ing. Bauer STAB-Tagung<br />
Bremen<br />
Prof. Hoffmann VDE-Kongress“Innovationen für Menschen“<br />
mit ITG-Fachtagung „Ambient Intelligence“<br />
Berlin<br />
Dipl.-Ing. Zeibig Vortrag Fo.-Kolloquium <strong>Universität</strong> Erlangen<br />
Erlangen<br />
Dipl.-Ing. Eichner<br />
Dipl.-Ing. Jokisch<br />
Dipl.-Ing. Lachmann<br />
Prof. Hoffmann<br />
Dipl.-Ing. Eichner<br />
Dipl.-Ing. Werner<br />
Dr.-Ing. Wolff<br />
Arbeitstreffen VRDG SIEMENS<br />
München<br />
Gemeinsame Präsentation mit VIC <strong>Dresden</strong><br />
München<br />
Dipl.-Ing. Jokisch ECESS Meeting (European Center of Excellence in<br />
Speech Synthesis)<br />
Universitat Politècnica de Catalunya, Barcelona<br />
Prof. Hoffmann<br />
Dr. Ding<br />
Dipl.-Ing. Jokisch<br />
4th International Symposium on Chinese Spoken<br />
Language Processing<br />
Hongkong<br />
Prof. Hoffmann Ausstellung “Phonorama“<br />
(Eine Kulturgeschichte der Stimme als Medium)<br />
Zentrum für Kunst- <strong>und</strong> Medientechnologie<br />
Karlsruhe<br />
68<br />
03.10. - 06.10.2004<br />
11.10.2004<br />
11.10. - 14.10.2004<br />
12.11.2004<br />
14.10. - 15.10.2004<br />
16.11. - 17.11.2004<br />
18.10. - 19.10.2004<br />
23.10. - 25.10.2004<br />
09.11.2004<br />
24.11.2004<br />
09.12. - 10.12.2004<br />
15.12. - 18.12.2004<br />
30.12.2004
Aktivitäten in der wissenschaftlichen Gemeinschaft<br />
11 Aktivitäten in der wissenschaftlichen Gemeinschaft<br />
11.1 Akademische Selbstverwaltung<br />
Dr.-Ing. G. Fuder<br />
- Mitglied der Berufungskommission „Kommunikationsakustik“<br />
Prof. R. Hoffmann<br />
- Mitglied des Konzils der TU <strong>Dresden</strong><br />
- Mitglied des Rates der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />
- Mitglied der Strukturkommission der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />
- Leiter der Studienrichtung Informationstechnik im Studiengang Elektrotechnik<br />
- Vorsitzender der Berufungskommission „Regelungs- <strong>und</strong> Steuerungstheorie“<br />
- Mitglied der Berufungskommission „Kommunikationsakustik“<br />
Prof. P. Költzsch<br />
- Mitglied der Fakultät Maschinenwesen<br />
Dr.-Ing. U. Kordon<br />
- Mitglied der Berufungskommission „Kommunikationsakustik“<br />
Dr. E. Kühnicke<br />
- Mitglied im Promotionsausschuss der <strong>Technische</strong>n <strong>Universität</strong> <strong>Dresden</strong><br />
11.2 Mitarbeit in Gremien<br />
Dr. V. Bormann<br />
- Mitglied der Deutschen Lichttechnischen Gesellschaft (LiTG), Bezirksgruppe <strong>Dresden</strong>;<br />
Vorstandsmitglied (Schriftführer <strong>und</strong> Schatzmeister)<br />
- Mitglied in REFA<br />
- Mitglied im Fachinstitut für Arbeitsaudit <strong>Dresden</strong> e.V. (FIAD); Geschäftsführung<br />
Dr. G. Fuder<br />
- Mitglied im DEGA-Fachausschuss „Hörakustik“<br />
- Mitglied im Normausschuss NALS/NATG A 1 „Terminologie <strong>und</strong> Einheiten der Akustik“<br />
- Mitglied im Normausschuss NVT 5 „Tontechnik in Theatern <strong>und</strong> Mehrzweckhallen“<br />
Prof. Dr. R. Hoffmann<br />
- Vorsitzender des ITG-Fachausschusses 7.4 "Sprachakustik“<br />
- Mitglied der ISCA Special Interest Group „Speech Synthesis“ (SynSIG)<br />
- Mitglied des Landesausschusses der U.R.S.I., Kommission C (Signals and Systems)<br />
- Gutachter im Programm des BMBF zur Förderung angewandter Forschung an Fachhochschulen<br />
im Verb<strong>und</strong> mit der Wirtschaft (FH³)<br />
- Reviewer für das Zentralblatt für Mathematik<br />
- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis)<br />
- Mitglied des Management Committee der Aktion COST 277<br />
Dipl.-Ing. O. Jokisch<br />
- Reviewer für JASA<br />
- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis)<br />
69
Aktivitäten in der wissenschaftlichen Gemeinschaft<br />
Prof. Dr. P. Költzsch<br />
- Mitglied des interdisziplinären Arbeitskreises Lärmminderungsforschung beim Umweltb<strong>und</strong>esamt<br />
- Mitglied der Deutschen Gesellschaft für Akustik (DEGA)<br />
- Mitglied des Vorstandsrates der DEGA<br />
- Mitglied der Jury zur Vergabe des Lothar-Cremer-Preises der DEGA bis August 2003<br />
- Mitglied der DEGA-Fachausschüsse „ Lehre in der Akustik“ <strong>und</strong> „Physikalische Akustik“<br />
- Mitglied des Deutschen Hochschulverbandes (DHV)<br />
- Obmann des Normausschusses NALS/NATG A1 „Terminologie <strong>und</strong> Einheiten der Akustik“ (bis<br />
Februar 2003)<br />
- Mitglied des Facharbeitskreises „Wohnges<strong>und</strong>heit <strong>und</strong> Innenausbau“ des Arbeitsgemeinschaft<br />
für Bauforschung im B<strong>und</strong>esministerium für Raumordnung, Bauwesen <strong>und</strong> Städtebau<br />
- Stellvertretender Obmann des Fachausschusses T 2.4 „Strömungsakustik/Fluglärm“ der DGLR<br />
(Deutsche Gesellschaft für Luft- <strong>und</strong> Raumfahrt)<br />
- Ordentliches Mitglied der Berlin-Brandenburgischen Akademie der Wissenschaften (vormals<br />
Preußische Akademie der Wissenschaften), Klasse Technikwissenschaften<br />
- Mitglied des Rates der Berlin-Brandenburgischen Akademie der Wissenschaften<br />
- Mitglied von „acatech“, dem Konvent für Technikwissenschaften der Union Deutscher Akademien<br />
der Wissenschaften<br />
- Gründungsmitglied des Universitären Zentrums für Luft- <strong>und</strong> Raumfahrt der <strong>Technische</strong>n <strong>Universität</strong><br />
<strong>Dresden</strong><br />
Dr. U. Kordon<br />
- Mitglied des ITG-Fachausschusses 7.3 „Sprachverarbeitung“<br />
Doz. Dr. E. Kühnicke<br />
- Mitglied des Board of Reviewers für JASA <strong>und</strong> Wave Motion<br />
- Mitglied des Fachausschusses Ultraschallprüfung der DGZfP (Deutsche Gesellschaft für<br />
Zerstörungsfreie Prüfung)<br />
- Mitglied im Unterausschuss „Theoretische Modelle in der Ultraschallprüfung“ der DGZfP<br />
- Mitglied im DEGA-Fachausschuss Ultraschall<br />
- Mitglied im Ausschuss Hochschullehrer im Lehrgebiet der ZfP<br />
- Mitglied TIMUG (Technologien in Medizin <strong>und</strong> Ges<strong>und</strong>heitswesen)<br />
Prof. Dr. G. Pfeifer<br />
- Mitglied des Arbeitskreises „Hochschullehrer für Messtechnik“<br />
- Gutachtertätigkeit für die DFG<br />
- Mitglied des Deutschen Hochschulverbandes (DHV)<br />
Dipl.-Ing. A. Zeibig<br />
- Mitglied AIAA (American Institute of Aeronautics and Astronautics)<br />
11.3 Mitarbeit in Programmkomitees<br />
Prof. Dr.-Ing. habil. R. Hoffmann<br />
- Jubiläumsveranstaltung „Zukunft durch Informationstechnik“, 50 Jahre ITG, Frankfurt,<br />
26. - 27.4.2004<br />
- KONVENS 2004, Konferenz „Verarbeitung natürlicher Sprache“, Wien, 14. – 17.9.2004<br />
- ESSV 2004, 15. Konferenz Elektronische Sprachsignalverarbeitung, Cottbus, 20. -22- 9.2004<br />
- VDE-Kongress „Innovationen für Menschen“, Fachtagung „Ambient Intelligence“ der ITG, Berlin,<br />
18. – 20.10.2004<br />
- International Conference „Speech Prosody 2006“, <strong>Dresden</strong>, 2. – 5.5.2006 (General Chair)<br />
Dipl.-Ing. O. Jokisch<br />
� International Conference „Speech Prosody 2006“, <strong>Dresden</strong>, 2. – 5.5.2006 (Technical Chair)<br />
70
Schlussbemerkung aus:<br />
Ulrich Bräker: Etwas über William Shakespeares Schauspiele … (1780)<br />
Reproduktion nach dem Erstdruck im Jahrbuch der deutschen Shakespeare-Gesellschaft 12 (1877).<br />
71