7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden

Technische Universität Dresden 

Fakultät Elektrotechnik und Informationstechnik 

Institut für Akustik und Sprachkommunikation 

Jahresbericht 2004 

Berichtszeitraum 1.1.2004 bis 31.12.2004

Postanschrift (Briefe): 

Technische Universität Dresden 

Fakultät Elektrotechnik und Informationstechnik 

Institut für Akustik und Sprachkommunikation 

01062 Dresden 

Postanschrift (Pakete): 

Helmholtzstr. 10 

01069 Dresden 

Besucheradresse: 

Helmholtzstr. 18 

Barkhausen-Bau 

Sekretariat: Zi. 54 

Telefon: ++49 - 351 - 463 37510 (Sekretariat) 

++49 - 351 - 463 32747 (Institutsdirektor) 

Fax: ++49 - 351 - 463 37781 

E-Mail: Ruediger.Hoffmann@ias.et.tu-dresden.de 

2

Inhaltsverzeichnis 


Inhaltsverzeichnis ....................................................................................................... 3 

Vorwort ....................................................................................................................... 5 

1 Mitarbeiterinnen und Mitarbeiter des Instituts für Akustik und 

Sprachkommunikation ..................................................................................... 7 

1.1 Mitarbeiterinnen und Mitarbeiter der AG „Technische Akustik“........................ 7 

1.2 Mitarbeiterinnen und Mitarbeiter der AG „Systemtheorie und 

Sprachkommunikation“ .................................................................................... 8 

2 Lehre................................................................................................................ 9 

2.1 Vorlesungen, Übungen, Praktika ..................................................................... 9 

2.2 Studienarbeiten.............................................................................................. 11 

2.3 Diplomarbeiten............................................................................................... 11 

2.4 Studienwerbung............................................................................................. 12 

2.5 Führungen mit Demonstrationen ................................................................... 12 

2.6 Umsetzung des akustischen Modells der Semperoper .................................. 13 

3 Forschung...................................................................................................... 14 

3.1 AG „Technische Akustik“ ............................................................................... 14 

3.2 AG „Systemtheorie und Sprachkommunikation“ ............................................ 28 

4 Drittmittelprojekte und haushaltfinanzierte Forschung ................................... 48 

4.1 Drittmittelprojekte........................................................................................... 48 

4.2 Haushaltfinanzierte Forschungsaufgaben...................................................... 50 

5 Veröffentlichungen ......................................................................................... 51 

5.1 Bücher, Buchbeiträge .................................................................................... 51 

5.2 Veröffentlichungen in Zeitschriften................................................................. 51 

5.3 TU-Informationen und Lehrmaterial ............................................................... 51 

5.4 Vortragsveröffentlichungen ............................................................................ 52 

5.5 Vorträge (ungedruckt) .................................................................................... 55 

5.6 Patente .......................................................................................................... 56 

5.7 Forschungsberichte ....................................................................................... 56 

5.8 Veröffentlichungen in Zeitungen und anderen Medien................................... 57 

5.9 Messeteilnahmen........................................................................................... 57 

6 Promotionen und Habilitationen..................................................................... 58 

3


7 Diplom- und Studienarbeiten ......................................................................... 59 

7.1 Diplomarbeiten............................................................................................... 59 

7.2 Studienarbeiten.............................................................................................. 59 

8 Wissenschaftliche Veranstaltungen ............................................................... 60 

8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem Lothar- 

Cremer-Preis der Deutschen Gesellschaft für Akustik im Jahre 2004 ........... 60 

8.2 Konferenz „Elektronische Sprachsignalverarbeitung“, 

Cottbus, 20. bis 22. September 2004............................................................. 61 

8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“ 

am 8. Dezember 2004 ................................................................................... 62 

8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“ ........................... 63 

9 Institutskolloquien .......................................................................................... 63 

10 Reisen............................................................................................................ 64 

11 Aktivitäten in der wissenschaftlichen Gemeinschaft....................................... 69 

11.1 Akademische Selbstverwaltung ..................................................................... 69 

11.2 Mitarbeit in Gremien....................................................................................... 69 

11.3 Mitarbeit in Programmkomitees ..................................................................... 70 

4

Vorwort 

Vorwort 

Der 1990 aufgenommenen Tradition folgend, legt das Institut für Akustik und Sprachkommunikation 

seinen Partnern und Freunden hiermit seinen 15. Jahresbericht vor. 

Auch in diesem Jahresbericht kann wieder eine positive Bilanz der Aktivitäten in Lehre und Forschung 

gezogen werden. Zu dem Blick auf das vergangene Jahr gehört aber auch, dass wir am 5. Juli 2004 

die traurige Nachricht erhielten, dass der langjährige Inhaber der Professur für Sprachkommunikation, 

Herr 

Prof. Dr.-Ing. habil. Walter Tscheschner, 

nach kurzer, schwerer Krankheit verstorben ist. Wir verdanken seinem Wirken den Aufbau des 

sprachtechnologischen Teiles unseres Instituts. Als 1968 das damalige Institut für Technische Akustik 

durch Hinzunahme weiterer Institutsteile zum Wissenschaftsbereich Kommunikation und Messwerterfassung, 

dem Vorgänger unseres heutigen Instituts, erweitert wurde, erfolgte damit an der TU Dresden 

eine bemerkenswert frühzeitige Institutionalisierung der Mensch-Technik-Schnittstelle als Forschungsobjekt. 

Es war ein glücklicher Umstand, dass für die Komponente der Sprachkommunikation 

Walter Tscheschner zur Verfügung stand, der mit seinen Arbeiten über das Sprachsignal eine Entwicklungslinie 

zur Spracherkennung und -synthese begründete, die in unserem heutigen Institut kontinuierlich 

weitergeführt wird. Wir haben ihn wegen seiner herausragenden menschlichen und wissenschaftlichen 

Qualitäten hoch geschätzt und werden sein Andenken in Ehren halten. 

Im Berichtsjahr wechselte der bisherige Inhaber der Professur für Technische Akustik, Herr Prof. Dr.- 

Ing. habil. Peter Költzsch, zum Ende des WS 2003/04 in den Ruhestand. Über das Ehrenkolloquium 

zu seinem 65. Geburtstag konnte bereits im vorhergehenden Jahresbericht berichtet werden. Er war 

ein Jahrzehnt an unserem Institut tätig, und wir danken ihm für seine erfolgreiche Arbeit in Lehre und 

Forschung und für seine engagierte Tätigkeit als Institutsdirektor. Wie man aus diesem Jahresbericht 

sieht, ist er weiterhin bei der Betreuung verschiedener Drittmittelprojekte aktiv tätig. 

Wie auch schon im Jahresbericht 2003 mitgeteilt werden konnte, war es trotz widriger Haushaltlage 

möglich, die freiwerdende Akustikprofessur unter der modifizierten Bezeichnung Kommunikationsakustik 

zur Nachbesetzung auszuschreiben. Im Berichtsjahr legte die Berufungskommission, die aus 

Vertretern eines breiten Fachspektrums zusammengesetzt war, einstimmig einen Listenvorschlag vor. 

Die Staatsministerin für Wissenschaft und Kunst ist diesem Vorschlag gefolgt und hat im Dezember 

2004 den Ruf an Frau Prof. Dr. phil. habil. Ute Jekosch erteilt. Sie ist derzeit Inhaberin einer Professur 

für Psychoakustik und Sounddesign an der School of Architecture des Rensselaer Polytechnic Institute, 

Troy, NY. 

Es besteht also (trotz aller anders lautenden Gerüchte und Zweifel, die sich im vergangenen Jahr 

leider in der Fachwelt ausbreiteten) aller Grund zum Optimismus, dass die Dresdner Akustik bald wieder 

in voller personeller und wissenschaftlicher Stärke aufgestellt sein wird. An dieser Stelle möchte 

ich besonders Herrn Prof. Dr.-Ing. habil. Günther Pfeifer danken, der zwischenzeitlich die Leitung der 

Akustikprofessur kommissarisch wahrnimmt und bereitwillig zusätzliche, umfangreiche Aufgaben in 

der Lehre übernommen hat. Das Institut kann dadurch auch im Übergangszeitraum, in dem die Akustikprofessur 

noch nicht wieder besetzt ist, seine Pflichtaufgaben in der Lehre ohne Abstriche erfüllen 

und zusätzlich ein breites Wahlprogramm für das Hauptstudium anbieten. 

Eine zusätzliche Verbreiterung der wissenschaftlichen Basis unseres Instituts wird sich durch eine 

vertiefte Kooperation mit dem Institut für Musikinstrumentenbau in Zwota ergeben. Mit diesem traditionsreichen 

Institut aus dem vogtländisch-erzgebirgischen Musikwinkel bestand bereits vor Jahren 

eine Zusammenarbeit auf dem Gebiet der Psychoakustik, die nun wieder aufgenommen werden soll. 

Der organisatorische Rahmen ist dadurch gegeben, dass die Trägereinrichtung des Instituts, der Vogtländische 

Förderverein für Musikinstrumentenbau und Innovation e. V. (VFMI), mit Wirkung vom 

2. 11. 2004 als An-Institut unserer Universität anerkannt ist. Diese Vereinbarung geht auf eine gemeinsame 

Initiative des VFMI, der Fakultät Elektro- und Informationstechnik, der Fakultät Maschinenwesen 

und der Fakultät Forst-, Geo- und Hydrowissenschaften zurück. 

Diese Vertiefung der Beziehungen zur Musikinstrumenten-Industrie ist ein aktuelles Beispiel für die 

Einbindung des Instituts in Gremien, Kooperationen und Förderprojekte, die Voraussetzung für die 

erfolgreiche Arbeit des Instituts ist. Wir danken allen Partnern, die uns auf vielfältige Weise unterstützt 

5

Vorwort 

haben. Ein besonderer Dank gilt wieder Frau Wilhelmine Willkomm für die stetige Förderung des wissenschaftlichen 

Nachwuchses. 

Ich möchte auch nicht versäumen, meinen Dank bei meiner langjährigen Sekretärin, Frau Uta Haase, 

die zum 31. März 2004 in den Ruhestand ging, abzustatten. Sie hat die Arbeitsgruppe „Systemtheorie 

und Sprachkommunikation“ seit 1993 mit Umsicht, Sachkenntnis, Geduld und Freundlichkeit betreut. 

Für die Zukunft wünschen wir ihr alles Gute, Gesundheit und Freude. 

Auch in dem nun begonnenen Jahr 2005 werden die Aufgaben nicht weniger werden. Die Fakultät 

Elektrotechnik und Informationstechnik hat zum laufenden Wintersemester die wiederum gestiegene 

Zahl von 575 Studierenden immatrikuliert, so dass die Lehrnachfrage weiter gesichert ist. In der Forschung 

wird es neben der Weiterführung der bestehenden Projekte darum gehen, neue Vorhaben zu 

akquirieren, um die wissenschaftliche Arbeit weiter finanzieren zu können. In der Professur Kommunikationsakustik 

werden das Projekte sein, die zur Gestaltung des neuen fachlichen Profils beitragen. In 

der Professur Sprachkommunikation zeichnet sich u. a. eine neue vertragliche Zusammenarbeit mit 

osteuropäischen Partnern ab. 

Beim Blick auf das vor uns liegende Jahr muss die Konferenz „Elektronische Sprachsignalverarbeitung“ 

erwähnt werden. Unser Institut ist seit 1990 an dieser jährlichen Veranstaltung beteiligt, die bisher 

an wechselnden Orten in Deutschland stattfand. Durch eine bereitwillige Zusage von Herrn Dr.- 

Ing. Dr.-Ing. E. h. R. Vích von der Tschechischen Akademie der Wissenschaften wird die 16. Konferenz 

in diesem Jahr im historischen Ambiente des Liechtenstein-Palais in Prag stattfinden. Sie wird 

vereinigt mit dem 15. Tschechisch-Deutschen Workshop „Speech Processing“ durchgeführt. Die Serie 

dieser Workshops pflegt besonders die Kooperation zwischen Phonetikern und Ingenieuren, die somit 

auch einen Schwerpunkt unserer Konferenz bilden wird. Ich bin sicher, dass der glanzvolle Ort der 

Konferenz diesmal eine besondere Anziehungskraft beweisen wird, und lade Sie herzlich ein, die Veranstaltung 

durch Ihre aktive Teilnahme auch inhaltlich zu einem Höhepunkt werden zu lassen. Der 

Termin ist der 26. - 28. September 2005. Nähere Informationen finden Sie unter 

www.ias.et.tu-dresden.de/essv2005 oder www.ias.et.tu-dresden.de/essp2005. 

Zum Konferenzgeschehen kann weiter berichtet werden, dass sich unser Institut im Jahre 2004 an der 

internationalen Ausschreibung zur Konferenz Speech Prosody 2006 beteiligt und den Zuschlag bekommen 

hat. Wir freuen uns über diesen Erfolg besonders deshalb, weil es erstmals gelungen ist, 

eine größere internationale Konferenz an unser Institut zu holen, und danken allen Fachkollegen und 

Institutionen, die diese Bewerbung unterstützt haben. Die Konferenz ist eine Veranstaltung der SPro- 

SIG (ISCA Special Interest Group on Speech Prosody) und wird vom 2. bis zum 5. Mai 2006 im neu 

errichteten Konferenzzentrum am Dresdener Elbufer stattfinden. Nähere Informationen bietet 

www.ias.et.tu-dresden.de/sp2006. 

Am Ende dieser einführenden Worte soll ein kleiner Hinweis zur Traditionspflege stehen. Unser Institut 

bewahrt das Gipsmodell der Dresdener Semperoper, das für die akustische Projektierung des Wiederaufbaus 

des 1945 zerstörten, legendären Opernhauses angefertigt wurde. Seit 2004 steht es öffentlich 

zugänglich im Eingangsbereich des Institutes. Über die vorher erforderliche Restaurierung des 

Modells wird in diesem Jahresbericht in Abschnitt 2.6 berichtet. Ein schöner Zufall wollte es, dass 

etwa zeitgleich der Mitteldeutsche Rundfunk an einem Fernsehbeitrag über den 1985 abgeschlossenen 

Wiederaufbau der Oper arbeitete und dabei Herrn Professor Kraak um Erläuterungen zur akustischen 

Komponente bat. So war es möglich, ihn und das erneuerte Modell am 29. Dezember 2004 am 

Bildschirm in einem Beitrag zu erleben, der neben der Sachinformation auch das sprichwörtliche 

Dresdener Traditionsbewusstsein zum Ausdruck brachte. 

Allen Mitgliedern und Freunden unseres Instituts wünsche ich ein erfolgreiches und gesundes Jahr 

2005. 

Im Januar 2005 Rüdiger Hoffmann 

6

Mitarbeiterinnen und Mitarbeiter 

1 Mitarbeiterinnen und Mitarbeiter des Instituts für Akustik 

und Sprachkommunikation 

Institutsdirektor 

Prof. Dr.-Ing. habil. Rüdiger Hoffmann 

1.1 Mitarbeiterinnen und Mitarbeiter der AG „Technische Akustik“ 

Hochschullehrerinnen und Hochschullehrer 

Prof. Dr.-Ing. habil. Peter Költzsch Leiter der AG (bis 31.03.2004) 

im Ruhestand (ab 01.04.2004) 

Telefon 

33041 

apl. Prof. Dr.-Ing. habil. Günther Pfeifer Leiter der AG (ab 01.04.2004) 

bis zur Wiederbesetzung 

32205 

Doz. Dr.-Ing. habil. Elfgard Kühnicke 32894 

Prof. Dr.-Ing. habil. Wolfgang Kraak im Ruhestand seit 1988 

Prof. Dr.-Ing. habil Arno Lenk im Ruhestand seit 1996 

Prof. Dr.-Ing. habil Walter Wöhle im Ruhestand seit 1993 

Wissenschaftliche Mitarbeiter 

Dr.-Ing. Günther Fuder 35374 

Wissenschaftliche Mitarbeiterinnen und Mitarbeiter auf Drittmittelstellen, Doktoranden 

Dipl.-Ing. Marcus Bauer DFG 33041 

Dr.-Ing. Volker Bormann (bis 31.05.2004) Bundesanstalt f. AuA, BBAW u. a. 32509 

Dipl.-Ing. Haike Brick DFG 34294 

Dipl.-Ing Stefan Folprecht (bis 30.11.2004) DFG 32253 

Dipl.-Ing Jörn Hübelt (bis 31.10.2004) DFG/FhG 32449 

Dipl.-Ing. Björn Knöfel BMBF 35524 

Dr.-Ing. Rafael Piscoya Rodriguez DFG 35524 

Dipl.-Ing. Dietmar Richter DFG/Microtech Gefell GmbH 32275 

Dipl.-Ing. Eric Starke (ab 01.10.2004) SFB 639 32253 

Dipl.-Ing. Andreas Zeibig DFG/DLR 32509 

Ingenieure 

Dipl.-Ing. (FH) Jürgen Landgraf 33521 

Dipl.-Ing. Andreas Witing 33547 

Promotionsstudenten/Stipendiaten 

Dipl.-Ing. Stephan Leschka (bis 30.04.2004) 32253 

Sekretärin/Institutssekretariat 

Frau Lianne Domaschke 37510 

7

Mitarbeiterinnen und Mitarbeiter 

1.2 Mitarbeiterinnen und Mitarbeiter der AG „Systemtheorie und 

Sprachkommunikation“ 

Hochschullehrer 

Telefon 

Prof. Dr.-Ing. habil. Rüdiger Hoffmann Leiter der AG 32747 

Prof. em. Dr.-Ing. habil. Dieter Mehnert Externer Mitarbeiter 

Wissenschaftliche Mitarbeiter 

Dr.-Ing. Ulrich Kordon 32240 

Dipl.-Ing. Matthias Eichner (bis 30.09.2004) anschließend GWT 36298 

Dipl.-Ing. Mathias Kortke 34849 

Dr.-Ing. Matthias Wolff 36298 

Projektmanager Signalverarbeitung und Mustererkennung der Gesellschaft für Wissens- und 

Technologietransfer mbH der TU Dresden 

Dipl.-Ing. Oliver Jokisch 32289 

Ingenieure 

Dipl.-Ing. Steffen Kürbis 33395 

Dipl.-Ing. (FH) Margitta Lachmann GWT 34283 

Mitarbeiter auf Drittmittelstellen bzw. Promotionsstudenten 

Dipl.-Ing. Maximiliano Cuevas DFG 34839 

Dr. phil. Hongwei Ding GWT 34283 

Dr.-Ing. Ute Feldmann Habil.-Stipendiatin 32721 

MSc. Hamurabi Gamboa Rosales Stipendiat 33106 

Dipl.-Ing. Hussein Hussein Stipendiat 32721 

Dipl.-Slaw. Rainer Jäckel GWT 32799 

MSc. Toshifumi Oba DFG 33106 

Dipl.-Ing. Guntram Strecha Siemens 34849 

Dipl.-Inf. Constanze Tschöpe DFG (FhG) 34839 

Dipl.-Ing. Steffen Werner DFG 32799 

Sekretärinnen 

Frau Uta Haase (bis 31.03.2004) 37656 

Frau Barbara Wrann 37656 

8

2 Lehre 

Lehre 

2.1 Vorlesungen, Übungen, Praktika 

Im Sommersemester 2004 und im Wintersemester 2004/2005 wurden die folgenden Lehrveranstaltungen 

durchgeführt: 

2.1.1 Pflichtfächer im Grund- und Hauptstudium 

Vorlesung „Systemtheorie I“ (Prof. R. Hoffmann) WS 04/05 

2 SWS Vorlesung,1 SWS Übung 3. Semester 

Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 550 Hörer 

und Nebenfach 

Vorlesung „Systemtheorie II“ (Prof. R. Hoffmann) SS 04 

2 SWS Vorlesung,2 SWS Übung 4. Semester 

Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 450 Hörer 

und Nebenfach 

Vorlesung „Systemtheorie III“ (Prof. R. Hoffmann) WS 04/05 

2 SWS Vorlesung, 2 SWS Übung 5. Semester 

Studienrichtung Informationstechnik 80 Hörer 

Vorlesung „Signal Processing“ (Prof. R. Hoffmann) SS 04 


Master-Studiengang 5 Hörer 

Vorlesung „Signalverarbeitung“ (Prof. R. Hoffmann) WS 04/05 


Studienrichtung Informationstechnik, Studiengang Informationssystemtechnik, 100 Hörer 

Master-Studiengang und Nebenfach 

Vorlesung „Akustik“ (Prof. G. Pfeifer) WS 04/05 


Studienrichtung Informationstechnik, Bakkalaureat Informations- und 67 Hörer 

Mikroelektronik, Nebenfach für Medieninformatik und Informatik, 

Master-Studiengang 

Praktikum „Computertechnik“ (Mitwirkung) SS 04 

Studiengang Elektrotechnik 2. Semester 

Versuch “Beurteilung der Klangfarbe von überlagerten Sinustönen” 

(Dipl.-Ing. A. Witing) 65 Teilnehmer 

Versuch „Akustischer Schalter“ (Dr. Kordon und Mitarb.) 80 Teilnehmer 

2.1.2 Wahlobligatorische Fächer (AG Technische Akustik) 

Vorlesung „Technische Akustik“ (Prof. G. Pfeifer) SS 04 


13 Hörer 

Vorlesung „Elektroakustik I“ (Prof. G. Pfeifer) SS 04 


18 Hörer 

Vorlesung „Theoretische Akustik“ (Doz. Dr. Kühnicke) SS 04 

2 SWS Vorlesung 8. Semester 

5 Hörer 

9

Lehre 

Vorlesung „Raumakustik und Beschallungstechnik“ (Dr. Ederer/Dr. Roy) SS 04 


16 Hörer 

Vorlesung „Ultraschall II“ (Doz. Dr. E. Kühnicke) SS 04 


5 Hörer 

Vorlesung „Elektromechanische Messtechnik“ (Prof. G. Pfeifer) SS 04 

2 SWS Vorlesung 6./8. Semester 

4 Hörer 

Vorlesung „Mechanische und elektronische Klangerzeugung SS 04 

bei Musikinstrumenten“ (Doz. Dr. E. Kühnicke) 40 Hörer 

2 SWS Vorlesung 

Praktikum „Computertechnik“ (Dipl.-Ing. A. Witing) SS 04 

Studiengang Elektrotechnik 2. Semester 

Versuch „Beurteilung der Klangfarbe von überlagerten Sinustönen“ 48 Hörer 

Praktikum „Akustik“ WS 04/05 

(Prof. R. Hoffmann/Prof. P. Költzsch/Prof. G. Pfeifer) 7. Semester 

4 SWS Praktikum (Dr. Fuder) 10 Hörer 

Seminar „Schallmesspraxis“ (Dr. G. Fuder) WS 04/05 

1 SWS Seminar, 1 SWS Praktikum 7. Semester 

18 Hörer 

Vorlesung „Elektroakustik II“ (Prof. G. Pfeifer) WS 04/05 


7 Hörer 

Vorlesung „Ultraschall I – Grundlagen“ (Doz. Dr. E. Kühnicke) WS 04/05 


12 Hörer 

2.1.3 Wahlobligatorische Fächer (AG Systemtheorie und 

Sprachkommunikation) 

Vorlesung „Signalanalyse und –erkennung“ (Prof. Hoffmann) SS 04 


15 Hörer 

Vorlesung „Psychoakustik“ (Dr. Kordon) SS 04 


74 Hörer 

Vorlesung „Technische Sprachkommunikation“ (Dr. Kordon) SS 04 


21 Hörer 

Praktikum „Technische Sprachkommunikation“ (Dr. Kordon) WS 04/05 

3 SWS Praktikum 7. Semester 

9 Teilnehmer 

Vorlesung „Spracherkennung I“ (Dr. Kordon) WS 04/05 


10 Hörer 

10

Lehre 

Vorlesung „Spracherkennung II“ (Dr. Flach, FhG) SS 04 


4 Hörer 

Vorlesung „Sprachsynthese“ (Dr. Kordon) WS 04/05 


26 Hörer 

Seminar „Signalprozessoren in der Audio-Signalverarbeitung“ (Dipl.-Ing. Kürbis) WS 04/05 

1 SWS Seminar, 1 SWS Praktikum 7. Semester 

10 Hörer 

Vorlesung „Chaos/Nichtlineare Systeme“ (Dr. Feldmann) WS 04/05 

2 SWS Vorlesung 7 Semester 

8 Hörer 

Hauptseminar „Systemtheorie/Sprachtechnologie“ (Prof. Hoffmann/Dr. Feldmann) WS 04/05 

1SWS Seminar 7 Semester 

5 Teilnehmer 

2.1.4 Lehrveranstaltungen für andere Studiengänge 

Vorlesung „Elektromechanische Netzwerke“ (Prof. G. Pfeifer) WS 04/05 


Fakultät Elektrotechnik, Studiengang Mechatronik 17 Hörer 

Vorlesung „Musikalische Akustik/Physiologische Akustik“ SS 04 

(Dipl.-Phys. A. Wilde, Prof. G. Hofmann) 47 Hörer 

1 SWS Vorlesung 

Fakultät Informatik/Nebenfach für Studiengang Medieninformatik und Informatik 

Vorlesung „Physikalische Grundlagen der Akustik“ (Doz. Dr. E. Kühnicke) WS 04/05 


Fakultät Informatik/Studiengang Medieninformatik und Informatik 56 Hörer 

Vorlesung „Signale und Systeme“ (Dr. U. Feldmann) SS 04 

2 SWS Vorlesung, 1 SWS Seminar, 1 SWS Praktikum 4. Semester 

Berufsakademie Sachsen (BA), Informationstechnik 37 Hörer 

2.2 Studienarbeiten 

Im Berichtszeitraum wurden am Institut für Akustik und Sprachkommunikation 10 Studienarbeiten 

angefertigt. Die Themen, die Bearbeiter und die Betreuer der Arbeiten sind im Abschnitt 7.2 aufgeführt. 

2.3 Diplomarbeiten 

Im Jahr 2003 wurden am Institut für Akustik und Sprachkommunikation 9 Diplomarbeiten verteidigt. 

Zwei ausländische Studenten fertigten ihre Diplomarbeiten am Institut an. Diese wurden jeweils an der 

Heimatuniversität verteidigt. Die Themen, die Bearbeiter und die Betreuer aller Diplomarbeiten sind im 

Abschnitt 7.1 zusammengestellt. 

11

2.4 Studienwerbung 

Lehre 

• Schnupperstudium am 15. Januar 2004 

Vorlesungen 

Vorlesung Akustik (mit Experimenten) Prof. Költzsch 

Besichtigungen 

Labor für Spracherkennung und –synthese Dr. U. Kordon 

Audioschallerzeugung mittels Ultraschall Dipl.-Ing. S. Folprecht 

Akustische Messräume (schalltoter Raum und Hallraum, Dipl.-Ing. A. Witing/ 

Audio-/video-Labor, Experimente im aerodynamischen Windkanal) Dipl.-Ing. D. Richter/ 

Dipl.-Ing. A. Zeibig 

Akustisches Modell der Semperoper Dresden Dipl.-Ing. D. Richter 

� „Uni-Tag“ am 24. April 2004 

Besichtigungen/ Vorführungen: 

Labor für Spracherkennung und Sprachsynthese Dr. U. Kordon 

Modell der Semperoper Dresden Dr. G. Fuder 

Hallraum, großer schalltoter Raum Dipl.-Ing. A. Witing 

• Sommeruniversität 2004 

Es fanden vier Veranstaltungen im Juli 2004 (08.07., 15.07., 22.07., 29.07.2004) im Rahmen der 

Sommeruniversität statt. 

Einführungsvorträge: „Einführung in die Akustik“ Dr. Fuder 

„Sprachanalyse und Sprachsynthese“ Dr. Kordon 

Besichtigungen: 

Labor für Spracherkennung und Sprachsynthese, Modell der Semperoper 

Akustische Messräume: Hallraum, großer schalltoter Raum, Windkanal 

Teilnehmer: jeweils 2 Gruppen (insgesamt 33 Abiturientinnen, Schülerinnen und Schüler) 

• Betreuung von Schülern 

Vier Schüler der 9. Klasse absolvierten am Institut ein zweiwöchiges Betriebspraktikum. In dieser Zeit 

wurden u.a.eine Multimedia-CD zur akustischen Erprobung der Semperoper erstellt und grafische 

Vorlagen zur Ansteuerung eines historischen Sprachsynthesesystems erarbeitet. 

2.5 Führungen mit Demonstrationen 

Die Teilnehmer erhielten eine Einführung in die Struktur sowie die fachlichen Aufgaben des Instituts 

und lernten die Studien- und Forschungsmöglichkeiten am Institut kennen. Es wurden akustische 

Spezialräume und Labors besichtigt sowie Verfahren der Sprachsynthese/Sprachanalyse 

demonstriert. 

• Führung von 80 Schülern des Gymnasiums Klotzsche 

Termin: 01.10.2004 

• Führung von 50 Schülern des Gymnasiums Klotzsche 

Termin: 04.10.2004 

� Einen besonderen Besucheransturm von über 300 Besuchern erlebte das Institut anlässlich der 

„Langen Nacht der Wissenschaften“, die am 25. Juni 2004, die gemeinsam von den Dresdner 

Wissenschaftseinrichtungen organisiert worden war. 

Unter der Überschrift „Experimente im Akustiklabor“ wurden 

o die Besichtigung des großen reflexionsarmen Raumes mit Demonstration des synthetischen 

Schallfeldes – Simulation des Höreindrucks in Räumen und 

o Experimente im Spracherkennungs- und Sprachsyntheselabor 

angeboten. 

12

Lehre 

2.6 Umsetzung des akustischen Modells der Semperoper 

Das Modell entspricht im Maßstab 1:20 dem Zustand des Zuschauerraumes der Semperoper vor der 

Zerstörung im II. Weltkrieg und diente der Ermittlung der ursprünglichen raumakustischen Kennwerte. 

Heute wird das Modell zur Erklärung der Modellmesstechnik innerhalb von Institutsführungen verwendet. 

Vor seiner Umsetzung stand das Opernmodell im so genannten Modellmessraum. Da dieser 

Raum gegenwärtig für andere Forschungsvorhaben genutzt wird und um dem Modell einen würdigeren 

Rahmen zu geben, sollte es in das Treppenfoyer im Sockelgeschoss des Barkhausenbaus umgesetzt 

werden. Nach Abnahme der Modellmaße wurde klar, dass das Modell durch keine Tür im Hause 

passt. In seiner Weitsicht bei der Projektierung des Modellmessraumes hatte Prof. W. Reichardt ein 

großes Fenster mit einer demontierbaren Mittelstrebe ausführen lassen, um große Modelle rein- und 

rauszutransportieren. Also hätten auch wir das Modell aus dem Barkhausenbau wieder herausbekommen 

– aber eben nicht wieder in das Foyer herein. So musste es also in mehrere Teile zerlegt 

werden. Da dies bei der Kompliziertheit der filigranen Gipskonstruktion kein einfaches Unterfangen 

war, zogen wir Experten zu Rate. Besonders den Fähigkeiten des bekannten Dresdner Bildhauers 

Vincenz Wanitschke ist es zu danken, dass die Zerlegung und Montage des Opernmodells gelang. 

Bildhauer Vincenz Wanitschke vor dem zerlegten Modell und aufgereihte Einzelteile 

Heute können wir das durch Institutsmitarbeiter eingehauste Modell wieder in voller Schönheit im Foyer 

bewundern. Zwei außen angebrachte Poster informieren zur Historie und zur Modellmesstechnik. 

Prof. W. Kraak, Leiter der akustischen Untersuchungen der Semperoper, vor dem Modell 

Prof. W. Kraak hielt am 9. Dezember 2004 im Rahmen der Vorlesung „Akustik“ einen Vortrag zum 

Thema: „Akustik der Semperoper“. 

(Dipl.-Ing. J. Landgraf) 

13

3 Forschung 

3.1 AG „Technische Akustik“ 

3.1.1 Verbrennungslärm 

Forschung 

Verbrennungslärm: Schallabstrahlung offener Jet–Diffusionsflammen 

In den ersten zwei Jahren des Forschungsprojektes „Modellierung der Schallabstrahlung von Flammen 

mit akustischen Ersatzstrahlern“ wurde vor allem die Anwendbarkeit der Ersatzstrahlermethode, 

/3/, (ESM) für freie Flammen untersucht. Parallel wurde ein Boundary-Elemente-Methode, /4/, (BEM)– 

Code entwickelt, um die Ergebnisse der ESM-Berechnungen verifizieren zu können. Das Forschungsprojekt 

ist ein Teilprojekt der von der DFG geförderten, überregionalen Forschergruppe „Combustion 

Noise“ /1/. 

Die Berechnung der Schallabstrahlung erfolgt nach einem Hybridverfahren, welches aus zwei Schritten 

besteht: 1.) die Bestimmung der akustischen Größen im Nahfeld und 2.) die Berechnung des 

Schallfeldes im Fernfeld. Der Grund dieser Teilung liegt im Unterschied der Zeit-, Raum- und Energieskalen 

von Strömung und Schallausbreitung begründet. In der Strömung befinden sich kleine Strukturen 

mit viel Energie, die sich mit kleiner konvektiver Geschwindigkeit ausbreiten. Der abgestrahlte 

Schall hat kleine Amplituden und trägt wenig Energie, besitzt aber große Wellenlängen aufgrund der 

hohen Ausbreitungsgeschwindigkeit. 

Die Schnelle im Nahfeld, d.h. der erste Schritt des Verfahrens, wird mit Hilfe einer Large-Eddy- 

Simulation berechnet, die das kooperierende Teilprojekt „Modellierung von Schallquellen in Verbrennungssystemen 

mit Hilfe der Grobstruktursimulation“ an der TU Darmstadt, Fachgebiet Energie- und 

Kraftwerkstechnik, durchführt. 

Nach einer Anpassung der geometrischen LES-Rechengitter an die Anforderungen der ESM bzw. 

BEM und der Fouriertransformation der Schnelledaten im Zeitbereich in Schnellespektren kann das 

Schallfeld im Fernfeld bestimmt werden. 

Zur Validierung der Ergebnisse wurde die abgestrahlte Schallleistung der simulierten Flammen mit der 

Intensitätsmessmethode am Darmstädter Institut vermessen. Abb.1 zeigt den Brenner und das Messgitter. 

Abbildung 1 Messung der 

Schallleistung der Jet- 

Diffusionsflamme (HD- 

Flamme) mit der Intensitätsmessmethode 

Die untersuchte Diffusionsflamme ist durch die folgenden Größen charakterisiert: Brennstoff 23% H2 / 

77% N2, Re = 16.000, Düsendurchmesser D = 8 mm, 

Austrittsgeschwindigkeit Ubulk = 36,3 m/s (HD-Flamme in /2/). 

In Abb. 2 sind die Messergebnisse für die HD-Flamme sowie die Berechnungsergebnisse der beiden 

akustischen Methoden dargestellt. Es ist zu sehen, dass die Simulationen die tatsächliche Schallabstrahlung 

der Flamme überschätzen, und zwar um maximal 5 dB. Der qualitative Verlauf der Kurve 

wird im tieferen und mittleren Frequenzbereich mit der BEM erstaunlich gut wiedergegeben. Die Ergebnisse 

der ESM weichen im tieferen Frequenzbereich etwas stärker von der gemessenen Kurve ab, 

14

Forschung 

die Ursache ist in der schlechten Konditionierung des Gleichungssystems bei tieferen Frequenzen zu 

suchen. 

Abbildung 2 

Terzspektren der abgestrahlten 

Schallleistung der HD- 

Flamme, 

– gemessen, -- mit BEM und 

.- mit ESM berechnet. 

Ab ca. 2000 Hz folgen die simulierten Kurven nicht mehr dem Abfall des gemessenen Frequenzganges. 

Die Ursachen für diese Abweichungen konnten bisher nicht abschließend geklärt werden. Auch 

andere Autoren beschreiben das Auftreten dieses hochfrequenten Störlärms bei Berechnung der 

Schallabstrahlung auf der Grundlage von Large-Eddy-Simulationen /5/. Eine Untersuchung der möglichen 

Ursachen für diese signifikante qualitative Abweichung sowie die Erweiterung der Methoden auf 

die Berechnung der Schallabstrahlung eingeschlossener Flammen ist für die folgende Projektphase 

geplant. 

(Dipl.-Ing. Haike Brick, Dr.-Ing. Rafael Piscoya) 

3.1.2 Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen 

und Oberflächendruckfelder (SWING+) 

Im Rahmen des DFG-Paketantrages „Numerische Aeroakustik für Verkehrsflugzeuge (SWING+)“ 

wurde im Zeitraum von 2001 bis 2004 das Projekt Schallquellenmodellierung mittels stochastischer 

Geschwindigkeitsschwankungen und Oberflächendruckfelder“ bearbeitet (Dr. Nikolai Kalitzin, Dipl.- 

Ing. Marcus Bauer, Dipl.-Ing. Andreas Zeibig, Dipl.-Ing. Dietmar Richter, Dipl.-Ing. Andreas Witing, Dr. 

Andriy Borisyuk), und zwar gemeinsam mit den Partnern: Institut für Aerodynamik und Gasdynamik 

der Universität Stuttgart, Aero-dynamisches Institut der RWTH Aachen, Hermann-Föttinger- Institut für 

Strömungsmechanik der TU Berlin, Institut für Aerodynamik und Strömungstechnik des DLR Braunschweig. 

Die Zielsetzung des TU-Projektes war die Weiterentwicklung, Verifizierung und Validierung des 

SNGR-Modells für einen CAA-Code und dessen exemplarische Anwendung zur Berechnung des Geräusches 

der Klappenseitenkantenströmung bzw. deren einzelnen Modellstufen. 

Arbeitshypothesen: 

- EULER-Gleichungen mit Quellgliedern können zur Berechnung strömungsakustischer Felder 

eingesetzt werden. Eine Aufspaltung der Variablen in einen zeitgemittelten und einen 

Schwankungsanteil ist sinnvoll. 

- Reale Turbulenz kann im Hinblick auf das o. g. Ziel durch stochastische, synthetische Geschwindigkeitsschwankungen 

unter Verwendung klassischer Turbulenzspektren 

(z. B. von-Kármán-Spektrum) nachgebildet werden. 

- Druckfelder auf der Oberfläche bzw. im Nahbereich von umströmten Körpern bilden prinzipiell 

das akustische Quellgeschehen ab und sind deshalb zur Quellmodellierung bei hybriden Verfahren 

(Aeroakustische Analogie) einsetzbar. 

- Numerische Verfahren und deren Lösungen gewinnen erst dadurch an Bedeutung, dass ihre 

Ergebnisse durch Messungen validiert worden sind. 

15

Forschung 

- Zur Validierung der Projektergebnisse sind aerodynamische, strömungsakustische und akustische 

Messungen durchzuführen. Dafür sind geeignete Messmethoden und Versuchsaufbauten 

zu realisieren bzw. neu zu entwickeln. 

In den drei Hauptabschnitten des TU-Projektes wurden folgende Ergebnisse erreicht: 

Schallquellenmodellierung: stochastische Geschwindigkeitsschwankungen (numerisches Verfahren: 

CAA-Modul: SNGR) 

Das ursprüngliche SNGR-Modell (Stochastic Noise Generation and Radiation) weist einige Unzulänglichkeiten 

auf: anfechtbare Grundgleichungen, Vermischung von Schall- und Turbulenzvorgängen, 

keine Störschallvermeidung (Störschall entsteht beim örtlichen Ein- und Ausblenden eines Quellterms 

im CAA-Rechengebiet, dadurch entscheidende Beeinflussung der Güte der Simulationsergebnisse). 

Deshalb musste das SNGR-Modell modifiziert werden. Danach wird der Schall nicht mehr direkt durch 

den Quellterm erzeugt, sondern indirekt durch Wechselwirkung der Turbulenz, die der Quellterm in 

den EULER-Gleichungen generiert, mit der Tragflügelhinterkante. 

Zu den Details: Der lineare Quellterm („Shear-Term“) erzeugt bei etwa 100 Moden für die synthetische 

Turbulenz deutlich mehr (indirekten) Schall als die nichtlineare Quelle („Self-Term“); außerdem ist die 

Störschallvermeidung mittels einer Gewichtsfunktion und die Vermeidung von Instabilitätswellen, die 

später Quellen für Störschall am Ausströmrand sind, mit dem linearen Term besser möglich. Das modifizierte 

von-Kármán Spektrum ist zur Generierung der synthetischen Turbulenz geeignet. Durch die 

Verwendung zusätzlicher Quellgebiete, beispielsweise eines zweiten Gebietes unter der Hinterkante, 

wurde gezeigt, dass sich bei dünner Kante Hinterkantenlärm vermeiden lässt, wenn die Turbulenz auf 

beiden Seiten des Objektes spiegelsymmetrisch zueinander ist (künstlich herbeigeführter Fall). 

Das modifizierte SNGR-Verfahren ist nunmehr prinzipiell geeignet, den Hinterkantenlärm vorauszuberechnen, 

siehe dazu z. B. die erfolgreiche Validierung bzw. Verifizierung von berechneten Richtcharakteristiken 

der Schallabstrahlung. Für eine exakte Vorhersage der Absolutwerte der abgestrahlten 

Schalldruckpegel sind allerdings noch weiterführende Untersuchungen zum SNGR-Modell notwendig. 

Das Quellmodell mit stochastischen Geschwindigkeitsschwankungen (SNGR-Modell) wurde als zusätzliches 

Modul in den CAA-Code PIANO [Delfs, Grogger, Lauke et al.] des DLR raunschweig implementiert. 

Eine wichtige Grundlage dieses Codes ist das hochgenaue Finite-Differenzen Schema von 

Tam und Webb. 

Schallquellenmodellierung: Oberflächendruckfelder (analytisches Verfahren) 

Es wurde ein analytisches Berechnungsverfahren für die Ermittlung des Zusammenhanges zwischen 

den Wanddruckschwankungen in der Nähe der Hinterkante und dem Fernschallfeld entwickelt. Der 

Vorteil eines solchen Verfahrens besteht darin, dass damit sehr verschiedenartig gewonnene Daten 

über die Wanddruckfelder als Schallquellenmodell verwendet werden können, und zwar empirische/halbempirische 

Modelle für die Wanddruckfelder (CORCOS, FFOWCS WILLIAMS, 

SMOL’YAKOV-TKACHENKO, CHASE u. a.), Wanddruckfelder aus numerischen Simulationen (z. B. 

aus LES, SNGR/LEE) und gemessene Wanddruckfelder (Messergebnisse zu den turbulenten Druckschwankungen 

bei überströmten Oberflächen, Umströmungskörpern und Abreißgebieten). 

Für bestimmte Strömungsfälle wurden die Fernfeld-Schalldruckspektren für verschiedene Wanddruckmodelle 

berechnet. Dabei zeigen alle Modelle sehr ähnliche Ergebnisse: der Hinterkantenlärm 

wird durch die konvektiven Wanddruckkomponenten beherrscht, die erfahrungsgemäß durch alle Modelle 

gleich gut beschrieben werden. Die Validierung dieses Rechenverfahrens steht noch aus. 

Validierung/Messungen 

Es ist von prinzipieller Bedeutung, die Validierung numerischer Simulationen und analytischer Rechenverfahren 

weiterzuentwickeln. Diese Erkenntnis resultiert aus der Beobachtung, dass gegenwärtig 

und in den letzten Jahren bei der Entwicklung numerischer Verfahren durch den rasanten Fortschritt 

in der Computertechnik eine extrem hohe Fortschrittsrate festzustellen ist, im Gegensatz dazu 

aber die für wissenschaftliche Arbeitsweise notwendige messtechnische Validierung weitestgehend 

nur kümmerlich behandelt wird. Deshalb muss einerseits insbesondere der Entwicklung bzw. Weiterentwicklung 

aerodynamischer, aeroakustischer und akustischer Messverfahren erhöhte Aufmerksamkeit 

geschenkt werden, andererseits aber auch dem methodischen Problem, Validierungsexperimente 

zu entwickeln, die auf die numerischen und analytischen Berechnungsfälle zugeschnitten sind. 

Während der Projektbearbeitung wurde der aeroakustische Windkanal des Instituts für die geplanten 

Validierungsmessungen optimiert (Einbau eines leistungsfähigeren Antriebs zum Erreichen höherer 

16

Forschung 

Strömungsgeschwindigkeiten, verbesserte Schallschutzmassnahmen zur weiteren Unterdrückung des 

Störgeräusches in der Messkammer). 

Die Validierungsmethoden für den Vergleich zwischen den numerischen/analytischen Rechenergebnissen 

und den Messergebnissen wurden systematisiert; neue Messmethoden wurden angewendet 

(Messung der Richtcharakteristik von Hinterkantenlärm am physikalischen Modell des Tragflügels im 

schalltoten Raum) sowie bestehende Messmethoden weiterentwickelt und verbessert (Mikrofonarray: 

Anwendung der Frequenzbandmittelung). 

Zu den Details: Mit der entwickelten und erprobten Messtechnik konnten sowohl Strömungs- als auch 

Schalldaten an verschieden Mess- und Rechenmodellen validiert werden. Am Beispiel von ebener 

Platte und NACA0012-Profil wurden erfolgreich RANS-Rechnungen mit Ergebnissen von Hitzdrahtmessungen 

verglichen. Die Hinterkante des NACA 0012 – Profils wurde mit dem entwickelten Mikrofonarray 

eindeutig als aeroakustische Hauptschallquelle identifiziert und ihre Schallabstrahlung quantitativ 

bestimmt. Die numerisch und analytisch berechnete Richtcharakteristik der Schallabstrahlung am 

Profil NACA0012 bzw. am Plattenmodell konnte sowohl durch Schalldruckmessungen im aeroakustischen 

Windkanal als auch durch Messungen am physikalischen Modell im schallreflexionsarmen 

Raum validiert werden. 

Durch detaillierte Untersuchungen von Beamforming-Algorithmen und Mikrofonarray-geometrien 

konnten über den allgemeinen Wissensstand hinausgehende Erkenntnisse über den Aufbau, die Optimierung 

und die praktische Anwendung von Mikrofonarrays gewonnen werden. Ein wichtiges Ergebnis 

sind die Ergebnisse hinsichtlich der Anwendung von neuen und weiterentwickelten Algorithmen bei 

Berücksichtigung der Messung von Absolutwerten. Zur Unterdrückung von störenden Nebenkeulen 

wird in Frequenzbändern gemittelt. Durch Untersuchung und Optimierung verschiedener Mikrofonanordnungen 

wurde eine angepasste Arraygeometrie, bestehend aus zwei Kreisringen, entwickelt. 

3.1.3 Akustische Simulationsverfahren (AKUSIM) 

(P. Költzsch, M. Bauer, A. Zeibig) 

AKUSIM (Akustische Simulationsverfahren) ist ein Teilprojekt des BMBF-Verbundprojektes "Leiser 

Verkehr". Ziel dieses Vorhabens ist die Schaffung und Bereitstellung von Berechnungswerkzeugen für 

den akustisch optimalen Entwurf von typischen Fahrzeugstrukturen. 

Strömungsschall 

Im Rahmen des AKUSIM - Arbeitspaketes "Strömungsgeräusch – Wanddruckschwankungen" beschäftigt 

sich das IAS speziell mit dem Umströmungsgeräusch starrer Bauteile, welches beim Hochgeschwindigkeitsverkehr 

(PKW, Bahn, Flugzeug) eine erhebliche Belastung der Bevölkerung und der 

Reisenden darstellt. Dazu werden am IAS sowohl numerische Berechnungen als auch Messungen 

(zur Validierung der berechneten Ergebnisse) durchgeführt. 

Eine computergestützte akustische Optimierung von Bauteilen im Hinblick auf das von ihnen verursachte 

Umströmungsgeräusch ist durch eine direkte numerische Lösung der entsprechenden Grundgleichungen 

(Navier-Stokes-Gleichungen, NSG) mit den heute verfügbaren Rechnerressourcen nicht 

möglich. Am IAS wird deshalb ein hybrides Verfahren verwendet, welches zwei vereinfachte Formen 

der NSG kombiniert. Im ersten Schritt werden die sog. RANS-Gleichungen (Reynolds Averaged Navier 

Stokes, zeitgemittelte NSG) mit dem CFD (Computational Fluid Dynamics) Code FLOWer des 

DLR (Deutsches Zentrum für Luft- und Raumfahrt) berechnet und die zeitabhängige Turbulenz als 

Schallquelle wird mittels statistischer Information aus der RANS- Lösung synthetisch erzeugt [1]. Im 

zweiten Schritt werden durch den CAA (Computational Aero-Acoustics) Code PIANO des DLR modifizierte 

Formen der Eulergleichungen (NSG ohne Reibung) gelöst, die von einem Quellterm angeregt 

werden. Dieser wird im Quellgebiet aus der synthetischen Turbulenz berechnet. 

17

Forschung 

Abbildung 3 Rechenergebnisse für eine Stufe mit rs = h/2 bei einer Anströmgeschwindigkeit von 50 

m/s: zeitgemittelte Strömung aus FLOWer (links) und Momentaufnahme des LEE- 

Schwankungsdruckes aus einer PIANO Testrechnung (rechts). 

Ziel der numerischen Untersuchungen am IAS ist die Vorausberechnung des Umströmungsgeräusches 

einer vorwärtsgeneigten Stufe als typisches Bauteil von Verkehrsmitteln (Beispiel: Fensterdichtungen). 

Dabei werden die Anströmgeschwindigkeit und die Stufenform variiert und zwei Modifikationen 

der Eulergleichungen, nämlich die Linearisierten Eulergleichungen (LEE) einerseits, sowie die 

Acoustic Perturbation Equations (APE) [2] andererseits, getestet. 

Abbildung 3 zeigt im linken Bild einen Ausschnitt der berechneten zeitgemittelten Strömung um eine 

Stufe mit der Höhe h = 12 mm und einem Krümmungsradius rs = h/2 bei einer Anströmgeschwindigkeit 

von 50 m/s (Ma = 0,147). Es sind Isoflächen der lokalen Machzahl Ma und ausgewählte Stromlinien 

dargestellt. 

Im rechten Bild ist eine Momentaufnahme des Schwankungsdruckes einer anschließenden instationären 

LEE-Testrechnung für diesen Fall zu sehen. Bei Verwendung der LEE befindet sich das Quellgebiet 

stromauf der Stufe und soll dort (möglichst leise) turbulente Fluktuationen anregen. Weil die zeitgemittelte 

Strömung in den Koeffizienten der LEE enthalten ist, folgen diese dann den Stromlinien, um 

schließlich an der Stufe den gesuchten Lärm zu erzeugen. Man erkennt sowohl die kleinskaligen turbulenten 

Fluktuationen im Bereich des Quellgebietes, als auch die Schallwellen. 

Zur Validierung der numerischen Untersuchungen werden am aeroakustischen Windkanal des Institutes 

Messungen an ausgewählten Teststrukturen durchgeführt und mit den Rechenergebnissen der 

Projektpartner verglichen. Zur Validierung aeroakustischer Simulationen ist insbesondere bei der Berechnung 

mit hybriden Methoden notwendig, sowohl Strömungs- als auch Schallfeldgrößen zu vergleichen. 

CSD in dB 

5 

0 

-5 

-10 

-15 

-20 

-25 

-30 

ohne Tripping 

mit Tripping 

-35 

50 100 200 

Frequenz in Hz 

500 1000 

Abbildung 4 Skizze der Fahrzeugmodellstruktur mit eingebauten Druckaufnehmern (K2-K4) ohne 

Endkappen (links) und Kreuzspektrum des Fernfeldschalldrucks und des von Druckaufnehmer 3 aufgezeichnete 

Wanddrucksignals (rechts, Modell jeweils ohne und mit Tripping, Anströmgeschwindigkeit 

vAnström = 34 m/s, p0 = 20 µPa) 

18

Forschung 

Als Teststruktur für die Messungen im Windkanal wurde eine generische Fahrzeugstruktur vom Typ 

„Strebe“ gewählt. Diese Fahrzeugstruktur besteht aus einem Halbzylinder mit angesetztem Heckdreikant 

variabler Länge und steht repräsentativ für eine ganze Reihe von aerodynamischen Schallquellen 

an Fahrzeugen, so. z.B. für Stromabnehmer (Bahn) und Fahrwerkskomponenten. 

An dieser Strebe wurden für verschiedene Heckdreikantlängen Messungen der hydro-dynamischen 

Wanddruckschwankungen, Hitzdrahtmessungen zur Bestimmung des Geschwindigkeitsfeldes in der 

Grenzschicht und im Nachlauf der umströmten Struktur sowie Schalldruckmessungen an ausgewählten 

Punkten im akustischen Fernfeld durchgeführt. 

Die Messungen der von Strömungs- und Schallfeldgrößen wurde zumindest teilweise simultan durchgeführt 

Damit war eine Untersuchung der Korrelation zwischen Strömungs- und Schallfeld [3] möglich, 

welche Rückschlüsse auf die Ursachen der Schallentstehung zuließ. 

Ein Bild der aufgebauten Teststruktur und das Ergebnis einer Kreuzkorrelation zwischen einem 

Wanddruckaufnehmer (K3) und einem Fernfeldmikrofon sind in Abbildung 4 dargestellt. Bei einigen 

messtechnischen Untersuchungen war zur gezielten Erzeugung der turbulenten Überströmung der 

Modellstruktur ein Trippstreifen an der Abrisskante des Modells (Übergang Halbzylinder – Heckdreikant) 

angebracht. 

In den bisher durchgeführten Untersuchungen war es möglich, zusätzlich zu der erwarteten Ausbildung 

einer Karman’schen Wirbelstraße („Querresonanz“) eine weitere hydrodynamische Instabilität 

(„Längsresonanz“) zu finden, welche unter bestimmten Bedingungen auch zur Schallabstrahlung führen 

kann [4]. Beschreibungen dieser Schwingungsform aus der Literatur sind bisher nicht bekannt, 

allerdings wurde in den numerischen Untersuchungen des Projektpartners DLR bei bestimmten Heckdreikantlängen 

eine ähnliche Schwingungsform entdeckt. 

[1] R. H. Kraichnan: Diffusion by a Random Velocity Field. The Physics of Fluids, Vol. 13, No. 1, pp. 

22-31, 1970 

[2] R. Ewert et. al.: Computation of Trailing Edge Noise via LES and Acoustic Perturbation Equations. 

AIAA-Paper 2002-2467, American Institute for Aeronautics and Astronautics, 2002. 

[3] Mueller, T. J. (Ed.).: Aeroacoustic Measurements. 1. Auflage. Berlin/Heidelberg. Springer-Verlag , 

2002 

[4] Achilles, S.: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellstrukturen. Diplomarbeit, 

TU Dresden, Institut für Akustik und Sprachkommunikation, 2004 

(Dipl.-Ing. A. Zeibig, Dipl.-Ing. M. Bauer) 

Körperschall-Energieflussmethode 

Bei der Konstruktion von Fahrzeugen besteht eine wesentliche Aufgabe in der Berechnung der 

Schallabstrahlung und der Fahrzeugschwingungen. Die Statistische Energieanalyse (SEA), eine Berechnungsmethode 

für mittlere und hohe Frequenzen, weist bei ihren Vorhersagen oft einige Einschränkungen 

auf, die vor allem aus ihrem statistischen Charakter resultieren. Aus diesem Hintergrund 

heraus werden nicht nur Erweiterungsmöglichkeiten zur SEA betrachtet, sondern es gibt verschiedene 

Bestrebungen, alternative Berechnungs-verfahren zu untersuchen. Eine der alternativen 

Theorien ist in eine Boundary Element Method integriert und basiert auf der lokalen Energieerhaltung 

in einem System. 

Diese Methode, die High Frequency Boundary Element Method (HFBEM), ist in einem Computerprogramm 

umgesetzt worden, dass die Schwingungsberechnung von punktförmig angeregten ebenen 

Strukturen, die aus beliebig vielen Einzelstrukturen bestehen, gestattet. 

Um dieses Verfahren nicht nur mit der SEA hinsichtlich ihres Konvergenzverhaltens zu vergleichen, 

sondern auch mit Messwerten von realen Strukturen, erfolgte bereits im letzten Jahr die Definition von 

drei fahrzeugtypischen Anwendungsfällen und die Konstruktion dieser in Form von drei generischen 

Fahrzeugstrukturen. Die Abbildungen 5 - 7 zeigen ein PKW-Bodenblech, den Hochflurbereich eines 

Regionalzuges in einem vereinfachten Aufbau, sowie eine verrippte Aluminiumplatte. 

19

Forschung 

Abbildung 5 PKW-Bodenblech Abbildung 6 Verripte Platte 

Abbildung 7 

Hochflurbereich eines Regionalzuges 

Berechnungen und Messungen: 

An allen 3 Strukturen erfolgten bereits Messungen des Schallübertragungsverhaltens, wobei hier stellvertretend 

einige Ergebnisse der verrippten Platte vorgestellt werden. In Abbildung 8 ist diese mit 

Längs- und Querversteifungen dargestellt, wobei die definierten Messpfade (L1,L2, Q0,Q1,Q2,Q3) 

eingezeichnet sind. 

20 

Abbildung 8 Messanordnung 

der verrippten Platte 

Während des Projektes liegt ein Schwerpunkt auf der Vorhersage 

von fahrzeugspezifischen Änderungen, d.h. inwieweit die 

HFBEM das Schwingungsverhalten der Strukturen vorhersagen 

kann, wenn an diesen praxisrelevante Änderungen 

durchgeführt wurden. Für die verrippte Platte fanden Messungen 

mit den Längs- und Querversteifungen, mit Längs- oder 

Querversteifungen, sowie ohne Versteifungen statt. Dabei 

wurde die Position der Messpfade beibehalten. Die Quelle bestand 

in Form eines elektromechanischen Schwingerregers, 

der die Platte zu Biegeschwingungen anregt. 

In den Abbildungen 9 und 10 sind die Ergebnisse der Frequency 

Response Function FRF = 10 log (v²/P) dB für den 

Messpfad Q2 bei 8 kHz der unversteiften Platte (Abbildung 9), 

sowie der längsversteiften Platte (Abbildung 10) dargestellt. In 

beiden Fällen wurde deutlich, dass die HFBEM erst bei hohen 

Dämpfungen (1% bei 8 kHz) den erwarteten Pegelabfall quantitativ 

widerspiegelt.

Forschung 

Bei geringeren Frequenzen ist die Materialdämpfung teilweise wesentlich kleiner als 1 %, wodurch die 

HFBEM ähnlich „glatte“ Verläufe wie die SEA prognostiziert. Im Falle der versteiften Platte (Abbildung 

10) berechnet die HFBEM einen der Messung vergleichbaren Pegelverlauf, der durch die zusätzliche 

– und in der Rechnung noch nicht berücksichtigte – Dämpfung durch die Versteifungen geringfügig 

über den Messwerten liegt. 

FRF 10 log (v² / P )dB 

0 

-10 

-20 

-30 

-40 

Messung HFBEM 

SEA 

-50 

0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80 

Abbildung 9 unversteifte Platte, f = 8kHz 

FRF 10 lg (v² / P) dB 

0 

-10 

-20 

-30 

-40 

Messung SEA 

HFBEM 

-50 

0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80 

Abbildung 10: längsversteifte Platte, f = 8kHz 

Zur Zeit erfolgen weitere Berechnungen und Messungen an den Fahrzeugstrukturen, wobei bei der 

HFBEM-Berechnung insbesondere der Zusammenhang zwischen Plattendämpfung und Randdämpfung 

untersucht wird. 

(Dipl.-Ing. B. Knöfel) 

3.1.4 Messung akustischer Charakteristiken von Modellstrukturen als 

Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln 

(gefördert durch die Friedrich-und-Elisabeth-Boysen-Stiftung) 

Der durch Strömungen verursachte Lärm stellt eine erhebliche Belastung der Bevölkerung und der 

Reisenden beim Hochgeschwindigkeitsverkehr dar. Während die Strategie bisheriger Lärmminderungsverfahren 

weitestgehend auf eine nachträgliche Lärmsanierung am konkreten technischen Gegenstand 

ausgerichtet war, ist das Ziel zukünftiger Vorgehensweisen beim Lärmschutz, durch die 

akustische Auslegung des Verkehrsmittels ein bereits leises Verkehrsmittel entstehen zu lassen. Dies 

bedeutet, dass die Lärmproblematik vollständig in den Entwurf und in die Konstruktion des Verkehrsmittels 

integriert wird. Diese Strategie der Lärmminderung erfordert akustische Modellierungs- und 

Simulationsverfahren, die die akustische Optimierung des virtuellen, noch nicht gegenständlich vorhandenen 

Verkehrs-mittels ermöglichen. 

Für die Realisierung dieser Vorgehensweise der Lärmbekämpfung müssen neben der Entwicklung 

aeroakustische Berechnungs- und Bewertungsverfahren insbesondere auch experimentelle aeroakustische 

Untersuchungen an Modellen von Fahrzeugstrukturen durchgeführt werden, im Spezialfall 

sind auch reine akustische Messungen (also ohne Strömung) an einfachen Bauteilen erforderlich. 

Diese Messaufgabe wurde mit finanzieller Unterstützung durch die Friedrich-und-Elisabeth-Boysen- 

Stiftung bearbeitet. 

Experimenteller Teil: 

• Als elektroakustische Punktschallquellen vom Typ Monopol, Dipol und Quadrupol wurden jeweils 

mehrere Lautsprecheranordnungen zur Realisierung eines Elementarstrahlertyps erprobt. Die akustischen 

Richtcharakteristiken dieser Schallquellen wurden im Großen Schallreflexionsarmen 

Raum, in Abhängigkeit von der Frequenz und dem Abstrahlwinkel, vermessen. Diese Punktschallquellen 

dienen als Modellquellen für die physikalischen Mechanismen der Strömungsschallerzeugung 

bei umströmten Strukturen. 

• Die Punktschallquellen wurden in unmittelbarer Nähe von typischen Modellstrukturen der Verkehrsmittel 

angebracht. Dabei wurden folgende Strukturen untersucht: 

- Dipol-Punktschallquelle hinter einer Platte: 

als Modell für den umströmten Tragflügel eines Flugzeuges und die Schallerzeugung an der 

Hinterkante, 

- Dipol-Punktschallquelle in der Ecke einer L-förmigen Platte: 

21

Forschung 

als Modell für die Schallerzeugung an der Klappenseitenkante eines Tragflügels mit ausgefahrener 

Landeklappe, 

- Dipol-Punktschallquelle im Schlitz zwischen zwei unterschiedlich breiten Platten: 

als Modell für die Schallerzeugung im Schlitz zwischen der ausgefahrenen Landeklappe und 

dem Tragflügel bzw. im Schlitz zwischen dem Vorflügel und dem Tragflügel. 

In den beiden erstgenannten Fällen wurden die Abstände der Schallquelle zur Plattenhinterkante bzw. 

die Anordnungen der Schallquelle an der Klappenseitenkante variiert. 

• Die Messergebnisse zeigen den frequenzabhängigen Einfluss der Abmessungen der Bauteilstruktur 

(Tragflügel-Sehnenlänge) auf die gerichtete Schallabstrahlung der Hinterkantenströmungsschallquelle 

bzw. der entsprechenden Modellschallquelle an der Klappenseitenkante bzw. im 

Schlitz zwischen Tragflügel und ausgefahrener Landeklappe. 

Theoretisch-rechnerischer Teil: 

Zum Vergleich der Messergebnisse aus dem schallreflexionsarmen Raum mit Rechenergebnissen 

wurden im Rahmen dieses Projektes folgende Untersuchungen durchgeführt: 

• Die Richtcharakteristik der Schallabstrahlung des Hinterkantenlärms wurde mit dem hybriden numerischen 

Verfahren SNGR+CAA (Stochastic Noise Generation and Radiation + Computational 

Aeroacoustics) berechnet. Dieses Verfahren wurde im Rahmen eines DFG-Verbundprojektes von 

der TU Dresden gemeinsam mit dem DLR Braunschweig entwickelt. Für den Vergleich mit den 

Messergebnissen aus dem schallreflexionsarmen Raum wurde der Richtungsfaktor der Schallabstrahlung 

frequenzabhängig auf einem Kreis um die Hinterkante an den Positionen von 120 virtuellen 

Mikrofonen berechnet. Dabei wurden die beiden Fälle der MACH-Zahl Ma = 0 und Ma = 0,11 

betrachtet: der erstgenannte Fall zum direkten Vergleich mit den reinen akustischen Messungen 

im schallreflexionsarmen Raum, siehe Abbildung 11 (Messungen erfolgte ohne Strömung), der 

letztgenannte Fall zur Beurteilung des Einflusses der MACH-Zahl (der bei niedrigen MACH-Zahlen 

gering ist). 

• Des Weiteren wurden die frequenzabhängigen Richtcharakteristiken der Schallabstrahlung des 

Hinterkantenlärms mit analytischen Rechenverfahren aufgearbeitet. Dabei ergaben sich aus den 

Theorien von FFOWCS WILLIAMS und HALL, von TAM und YU sowie von HOWE interessante 

Einblicke in den physikalischen Wirkungsmechanismus der Schallerzeugung an der Hinterkante. 

Mit der exzellenten, aber sehr komplizierten Theorie von HOWE konnte mit dem Computer der 

gesamte Frequenzbereich der Schallabstrahlung erfasst werden, und zwar von HELMHOLTZ- 

Zahlen kL > 1 (k Wellenzahl, L Sehnelänge des Tragflügels). Der Übergang von 

der Dipol-Richtcharakteristik (kompakte Quelle, kL

210 

120 

(SNGR+CAA) 

Forschung 

p/pmax 

90 90 

1 

60 Rechnung 

120 

0.8 

Messung 

06 

0.4 

0.2 

180 0 

150 

240 

270 

kL = 3 kL = 5 

90 

270 

Abbildung 11 

Richtcharakteristik des Hinterkantenlärms 

kL = 10 Vergleich: Messung/Rechnung 

G' 

Abbildung 12 Richtcharakteristik ( kL, 

Θ) 

des Hinterkantenlärms, berechnet mit der Theorie 

G' 

von HOWE 

300 

120 60 

30 

θ 

330 

180 0 

210 

240 

300 

30 

θ 

330 

Rechnung 

Messung 

max 

180 

150 

210 

240 

270 

60 

300 

30 

Rechnung 

Messung 

θ 

330 

0 

23

Forschung 

Die Arbeiten am Forschungsprojekt „Messung akustischer Charakteristiken von Modellstrukturen als 

Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln“ dienten als akustische Vor 

felduntersuchungen für die Entwicklung leiser Fahrzeugstrukturen beim Hochgeschwindigkeitsverkehr. 

Die Messungen im schallreflexionsarmen 

Raum und die dabei realisierte elektroakustische Modellie- 

rung der Strömungsschallquellen stellen eine neue aeroakustische Messmethode dar, die in dieser 

Form und mit diesen Ergebnissen bisher in der Fachliteratur nicht gefunden werden konnte. Der Vergleich 

zwischen den Messergebnissen und den Rechenergebnissen (numerische und analytische 

Verfahren) trug ganz wesentlich zum physikalischen Verständnis der Schallerzeugung und Schallabstrahlung 

von umströmten Strukturen bei. 

(P. Költzsch, A. Witing, M. W. Kettlitz) 

3.1.5 Integrierte Sensornetzwerke, Teilprojekt im SFB 639 

Seit Januar 2004 wird im Rahmen des DFG-Sonderforschunmgsbereiches 

„Textilverstärkte Verbundkomponenten 

für funktionsintegrierende Mischbauweisen bei komplexen Leichtbau-anwendungen“ 

SFB 639 das Teilprojekt „Integrierte Sensornetzwerke“ bearbeitet. Gemeinsam mit dem Fraunhofer 

Institut 

für Photonische Mikrosysteme werden Sensornetzwerke entworfen, die vollständig in textilverstärkte 

Bauteile aus Glasfaser-Polypropylen-Verbunden integrierbar sind. Derartige Bauteile werden 

aus mehreren textilen Lagen von Geweben oder Gestricken durch Verpressen bei Schmelztemperatur 

der Thermoplastkomponente gefertigt. 

Das Ziel der Anwendung von bauteilintegrierten Sensornetzwerken ist einerseits, die Erkennung von 

Ereignissen, welche plötzlich und zeitlich unbestimmt eintreten können und andererseits, die permanente 

Funktionsüberwachung von sicherheitsrelevanten Bauteilen. Plötzlich eintretende Ereignisse 

können z. B. bei Crashsituationen an Fahrzeugfrontmodulen oder durch Schlageinwirkungen an 

Schutzhelmen hervorgerufen werden. 

Das Systemkonzept umfasst auch den Entwurf von elektronischen Komponenten, wie Controller-, 

Sensor- und Transponderchips am Fraunhofer Institut für Photonische Mikrosysteme. 

Wesentliche Untersuchungen konzentrieren sich auf Systeme, die eine drahtlose Energie- und Datenübertragung 

voraussetzen. Derartige Systeme sind beispielsweise erforderlich, wenn in der Einsatzumgebung 

ein erhöhtes Explosionspotenzial besteht, das zu überwachende Bauteil vor Manipulationen 

geschützt werden soll oder eine Leitungsminimierung angestrebt wird (Fahrzeugbau). Für den 

Einsatz solcher Sensornetzwerke stehen im Fall des autonomen Betriebs nur sehr begrenzte Energieressourcen 

zur Verfügung. Insbesondere für den Fall, dass schnell ablaufende Vorgänge mit großer 

zeitlicher Auflösung erfasst werden sollen, ergeben sich außerordentlich hohe Anforderungen bezüglich 

des Energieverbrauches. Aufgrund der Energieknappheit bei der ebenfalls in den textilen Werkstoff 

integrierten Stromversorgung besteht das Interesse, eine Datenerfassung ereignisgesteuert auszulösen. 

Für den Fall, dass kein Grund besteht, eine Datenaufzeichnung bzw. Auswertung vorzunehmen 

(Ruhezustand), sollen nur die benötigten Komponenten des Systems mit Energie versorgt werden. 

Im günstigsten Fall ist das System völlig ausgeschaltet. Zum schnellen Aktivieren der Elektronik 

aus dem stromfreien Standby-Betrieb im Moment eines kritischen Ereignisses soll ein Sensor entworfen 

werden, der bei Überschreiten eines bestimmten Schwellwertes der Beschleunigung so viel Energie 

erzeugt, dass ein Einschalten der Elektronik möglich ist. Hierfür ist die Konzeption eines piezoelektrischen 

Beschleunigungssensors vorgesehen. Der Entwurf des speziellen Wandlers muss sich 

durch hohe Temperaturbeständigkeit (Konsolidierungstemperatur während der Integration beträgt 

220 °C), sehr flache Bauform (geringe Festigkeitsminderung des Bauteils), robuste Ausführung (Verpressen 

der Glasfaser-Thermoplastmatten bei 5 bis 10 bar) und konstruktiv einstellbare Triggerbeschleunigungs-werte 

auszeichnen. 

Durch die Konsolidierungsbedingungen werden hohe Anforderungen an die Fertigungstechnologien 

zur zerstörungsfreien Integration von elektronischen Baugruppen, Aktoren und Sensoren gestellt. In 

Abbildung 13 sind die zu integrierenden 

Baugruppen dargestellt. Nach gelungener Integration der 

Systemkomponenten ist deren Resistenz gegenüber Stoßbeschleunigungen zu prüfen und die Reduktion 

der Bauteilfestigkeit durch die integrierte Messtechnik zu analysieren. 

Erste Ergebnisse zum Thema „Aufwecksensor“ wurden durch Integration von Piezokeramik-Metall- 

Biegeplatten in den Verbundwerkstoff erzielt. Die zur Triggerung der Elektronik notwendige Energie 

kann je nach Beschleunigungsschwellwert durch ca. 0,5 mm dicke Sensoren mit (10...20) mm Durchmesser 

erzeugt werden. Die kommerziell verfügbaren Piezoelemente erfüllen 

allerdings nicht die 

Dauerfestigkeitsforderungen bei hohen Stoßbeschleunigungen. Daher laufen gegenwärtig Arbeiten 

zum individuellen Aufwecksensorentwurf, auch hinsichtlich der Geometrieminimierung. Durch Messungen 

mit mehreren, in orthogonal verstärkten Plattenstrukturen, integrierten Aufwecksensoren wur- 

24

Forschung 

den die Wellenausbreitungsgeschwindigkeiten mit (500...1000)m/s ermittelt. Daraus leitet sich die 

Notwendigkeit eines verteilten Sensornetzwerkes, mit Sensorabständen im Bereich von 10 cm ab, 

wenn reale Stöße innerhalb weniger 100 µs aufgezeichnet werden sollen. Zur Beschleunigungsmessung 

in Plattenstrukturen wurden erste integrierfähige Sensoren entworfen, deren Beschleunigungs- 

Zeit-Funktion gut mit den Messungen von extern befestigten Beschleunigungssensoren und der mit 

einem Laservibrometer bestimmten Oberflächenbeschleunigungen korreliert. 

Abbildung 13: Technologische Aufgaben bei der Integration von Messtechnik in Bauteile aus textilen 

Schichten 

Neben 

der Messung von Beschleunigungen in Crashsituationen ist auch die Erfassung von Deh- 

nungszuständen an größeren Faserverbundstrukturen, wie Fahrzeugfrontmodulen von Interesse. Um 

den Dehnungszustand von Verstärkungsfasern innerhalb des Werkstoffes ohne eine Festigkeitsverringerung 

des 

Bauteils bestimmen zu können wird der Einsatz von Kohlenstofffasern als Messelement 

untersucht. 

Hierbei wirken die Messelemente nicht als Störung, sondern selbst als Verstärkungsfasern. 

Derartige Messelemente wurden entworfen und in die Glasfaser-Polypropylen-Verbunde integriert. 

Die Messfehler liegen derzeit im Prozent-Bereich. Schwierigkeiten bereitet noch die gestreckte 

Applikation der Kohlenstoff-Rovings und deren stabile Kontaktierung. 

Um elektronische Bauelemente in den Verbundwerkstoff zu integrieren zu können, wurde deren Temperaturfestigkeit 

untersucht. Dafür wurden Chips der CMOS-Technologie XC06 mit Temperaturen bis 

300 °C über 20 min beaufschlagt und anschließend bei Raumtemperatur auf ihre Funktion getestet. 

Alle Funktionen von Mikrocontroller, RAM, EEPROM und Flash konnten erfolgreich geprüft werden. 

(Prof. G. Pfeifer, Dipl.-Ing. J. Landgraf, Dipl.-Ing. S. 

Folprecht, Dipl.-Ing. E. Starke) 

3.1.6 Ultraschallwandler für gerichtete Audioschallabstrahlung und 

Simulationsverfahren für spezielle Anwendungen in der 

Elektroakustik 

Die seit 1999 laufenden Arbeiten zum Industriethema „Gerichtete Audioschallwiedergabe mittels 

Ultraschall“ 

wurden abgeschlossen. Die Leistungsgrenzen dieses Verfahrens, die Leistungsgrenzen 

verschiedener 

Ultraschallwandlerverfahren und die aktuell vorhandenen Möglichkeiten eines 

praktischen 

Einsatzes 

wurden zusammenfassend 

dargestellt und so eine Beurteilung der Kosten-Nutzen-Relation 

beim 

Auftraggeber ermöglicht. 

In einer Einsatzstudie, durchgeführt von Studenten der FH Furtwangen, Fachbereich Product Engineering, 

wurden weitere Möglichkeiten der Anwendung untersucht. Diese Arbeiten wurden durch einen 

Vortrag und Konsultationen unterstützt [4]. 

Einen weiteren Schwerpunkt bildeten Simulationsverfahren, die besonders für Anwendungen der Elektroakustik 

vorteilhaft sind (Netzwerktechnik) 

[88]. Es wurden Verfahren untersucht. die die Parametrierung 

komplizierter akustischer und mechanischer Bauteile als Näherungslösung durch statische 

Finite-Elemente-Techniken ermöglichen. 

25

Forschung 

Darüber hinaus wurden für den industriellen Auftraggeber Finite-Elemente-Rechnungen für aktuelle 

Mikrofonentwicklungen vorbereitet, die eine einfache Anwendung auf der Rechentechnik des AG ermöglicht. 

Mit der Optimierung von Magnetsystemen in elektroakustischen Geräten mit der Finite- 

Elemente-Technik wurde begonnen. 

(Prof. Dr. G. Pfeifer) 

3.1.7 Mikrofon mit weitgehend frequenzunabhängiger 

Richtcharakteristik 

Zur Formung spezieller Richtcharakteristiken werden in der Elektroakustik meist 

mehrere elementare 

Schallwandler räumlich zu Zeilen, Spalten oder Arrays zusammengestellt. Ohne besondere 

Maßnahmen 

sind die zu erzielenden Richtcharakteristiken 

frequenzabhängig. 

Die 

Richtcharakteristiken ergiben sich dabei stets aus dem Verhältnis der geometrischen Abmessun- 

gen der Anordnung zur Wellenlänge. 

Für einige Anwendungen im Bereich der Beschallungs- oder Aufnahmetechnik stört diese Frequenzabhängigkeit. 

Um eine Forderung nach einer weitgehend frequenzunabhängigen 

Richtcharakteristik 

zu erfüllen, müssten sich die Abmessungen der Schallwandleranordnung frequenzabhängig ändern. 

Eine Lösungsmöglichkeit, die Abmessungen 

scheinbar frequenzab-hängig zu ändern besteht darin, 

den benötigten Frequenzbereich in einzelne Teilbereiche zu zerlegen, eine größere Anzahl von Wandlern 

einzusetzen und jedem Teilfrequenzbereich nur bestimmte Wandler zuzuordnen. Die Zuordnung 

der Wandler zum jeweiligen Frequenz-bereich muss dabei so erfolgen, dass die Abstände der im jeweiligen 

Frequenzbereich aktiven Wandler zueinander zur Wellenlänge möglichst konstant bleiben. 

Nach diesem Prinzip arbeitet das Kardioid- Ebenen- Mikrofon KEM 970 der MICROTECH GEFELL 

GMBH. 

Dieses Mikrofon besitzt in der Horizontalebene die Richtcharakteristik einer Superniere, in der Vertikalebene 

dagegen die eines Richtmikrofons mit einem Öffnungswinkel von ca. 20º. Im KEM 970 wer- 

den 

acht Mikrofonkapseln mit Supernierencharakteristik eingesetzt. Je nach Frequenzbereich werden 

unterschiedliche 

Mikrofonsignale addiert und mit einer Filterbank bewertet. Nach Addition der Signale 

der Filterbank ergeben sich wieder ein weitgehend linearer Frequenzgang und die gewünschte Richtcharakteristik. 

Die ursprüngliche Entwicklung, die zum KEM 970 führte, wurde vor ca. 10 Jahren im INSTITUT FÜR 

RUNDFUNKTECHNIK begonnen. Neben den für Mikrofone üblichen Mikrofonkapseln und deren Vor- 

26

Forschung 

verstärker, 

wird im KEM 970 eine umfangreiche analoge Schaltungstechnik zur Bearbeitung der Mik- 

rofonsignale notwendig. 

In den letzten Jahren begann auch im Bereich der Mikrofontechnik eine Entwicklung hin zur digitalen 

Signalverarbeitung. Die ersten Mikrofone mit integriertem digitalen Signalprozessors (DSP) sind auf 

dem Markt. Der DSP übernimmt 

dabei meist die Aufgaben den Dynamikumfang der Mikrofone durch 

mehrere pegelmäßig kaskadierte ADC zu erhöhen (STAGETEC TRUEMATCH) und die Realisierung 

des digitalen Audiointerface. Für die umfangreiche Signalverarbeitung im KEM bietet sich der Einsatz 

eines DSP an. Am Beispiel des KEM 970 wurden am IAS alle zur Signalverarbeitung notwendigen 

Algorithmen für den Signalprozessor ADSP21161N von ANALOG DEVICES erstellt und erfolgreich 

getestet. Es zeigte sich, dass sich alle bisherigen analogen Signalverarbeitungsstufen des KEM durch 

digitale Signalverarbeitung vorteilhaft ersetzen lassen. Einen deutlichen Qualitätsgewinn brachte die 

digitale Signalverarbeitung im Bezug auf den zu erreichenden Signal- Rauschabstand. 

Die Programmierung des ADSP21161N erfolgte in der Sprache ANSI-C. Dabei musste festgestellt 

werden, dass diese Programmiersprache den DSP nur schlecht unterstützt, so dass die programmierten 

Algorithmen nur bis zu einer Abtastfrequenz von 48 KHz zuverlässig funktionierten. 

Für höhere 

Abtastfrequenzen und umfangreichere Filterstrukturen ist deshalb die Programmierung zukünftig in 

Assemblersprache notwendig. 

(Dipl.-Ing. D. Richter) 

3.1.8 Bestimmung von Kenngrößen eines Telefonhörers 

Für den Hersteller von Kommunikationstechnik PRAGMA, Zittau, wurden Messungen 

zur Bestimmung 

von Kenngrößen eines Telefonhörers durchgeführt. Dabei war die Ermittlung von 

Übertragungsmaß 

und 

Spektrum einer Hörkapsel für vorgegebene, spezielle Ansteuerbedingungen von besonderem 

Interesse. 

Die Messungen erfolgten mit Hilfe eines künstlichen Ohres nach IEC 318 (Artificial Ear Type 4153, 

Brüel & Kjaer). 

Vorab war die Gestaltung der mechanischen Ankopplung der Hörkapsel an das künstliche Ohr zu 

klären. Das Ziel dabei war, die Relevanz der Messergebnisse nachzuweisen und eine ausreichende 

Reproduzierbarkeit 

zu sichern. Im Ergebnis gelang es, charakteristische Daten für die Hörkapsel zu 

erhalten, die den Messvorgaben ausreichend gerecht wurden. 

(Dr. G. Fuder) 

27

Forschung 

3.2 AG „Systemtheorie und Sprachkommunikation“ 

3.2.1 Vorbemerkung 

Die Arbeitsgruppe betreibt weiterhin Signal- und Systemtheorie mit besonderer Betonung der Anwendung 

in der Sprachtechnologie. Die Arbeiten gruppieren sich um die beiden, nun schon über eine Anzahl 

von Jahren gepflegten experimentellen Systeme UASR und DRESS. 

Das System UASR (unified approach for speech synthesis and recognition), das zur experimentellen 

Untersetzung des Analyse-durch-Synthese-Prinzips konzipiert wurde, dient gegenwärtig hauptsächlich 

als Plattform für Erkennerexperimente. Die Technologie ist inzwischen so weit ausgereift, dass neben 

der Abspaltung von Lösungen für die Spracherkennung (z. B. Speech-Applet für Projekte der Webbasierten 

Lehre) sogar erfolgreiche Anwendungen auf nichtsprachliche Signale möglich wurden (Maschinendiagnose, 

medizinische Diagnose, Musiksequenzen), zu denen u. a. ein DFG-Projekt in Kooperation 

mit dem Fraunhofer Institut für zerstörungsfreie Prüfverfahren im Berichtsjahr begonnen 

werden konnte. 

Das System DRESS (Dresdner Sprachsynthese) wird ebenfalls als Forschungssystem weitergeführt 

und diente im Berichtszeitraum hauptsächlich zur vertieften Untersuchung von Prosodiemodellen. Für 

die Finanzierung der Forschungsarbeiten bildet die praktische Anwendung von DRESS in einer Embedded-Variante 

die wichtigste Quelle. Diese Arbeiten wurden im Rahmen der Virtuel Research and 

Development Group (VRDG) mit der von Prof. Höge geleiteten Siemens-Arbeitsgruppe weitergeführt. 

Beide Einrichtungen waren 2004 Gründungsmitglieder des European Center of Excellence on Speech 

Synthesis (ECESS); vgl. www.ecess.org. 

Die folgende Darstellung bietet eine Übersicht vornehmlich zu den Arbeiten an den beiden genannten 

Komplexen. Von den recht zahlreichen kleineren Aktivitäten wird danach eine Auswahl beschrieben. 

3.2.2 UASR (Unified Approach for Speech Synthesis and Recognition) 

Das Forschungssystem UASR beschäftigt sich mit der „Integration von Spracherkennung und Sprachsynthese 

unter Verwendung gemeinsamer Datenbasen“. Über dieses Projekt haben wir bereits in den 

Jahren 2002 und 2003 berichtet. Für einen Überblick über die Ziele und die Systemarchitektur wird auf 

die entsprechenden Jahresberichte sowie auf [1] verwiesen. Die Anwendung und der Ausbau des 

Systems wurden im Rahmen von zwei DFG-Projekten fortgeführt. Im Berichtsjahr entstand eine ausführliche 

Dokumentation auf HTML-Basis (Abbildung 14). 

In diese Dokumentation wurden die Beschreibungen der Module des Systems, zugehörige Konferenzbeiträge 

und technische Beschreibungen, sowie anwendungsspezifische Dokumente aufgenommen. 

Algorithmische Weiterentwicklungen fanden vor allem bei den Methoden zur Verarbeitung von FSMs 

(finite state machines) statt. Auf diese Arbeiten wird im Abschnitt b) eingegangen. Weiterhin wurde die 

Integration von Verfahren zur Sprechernormalisierung (VTN) fortgeführt und die Ergebnisse auf der 

ICASSP 2004 vorgestellt [2]. 

Im Jahresbericht 2003 hatten wir über einen Sprachdienst mit verteilter Architektur berichtet, der im 

Rahmen des Projektes eL-IT eingesetzt wurde. Wir haben den Spracherkenner weiterentwickelt und 

um eine Stimmaktivierung ergänzt (Abschnitt c). Durch die Client/Server-Architektur eignet sich das 

System besonders zur Integration von Sprachtechnologie in bestehende Anwendungen. In einer Diplomarbeit 

wurde die Sprachsteuerung eines Computerspiels in Hinblick auf die ergonomischen Qualitäten 

untersucht ([5], siehe Abschnitt d). 

a) LM-Synergien 

Im Jahresbericht 2003 haben wir gezeigt, wie der Einsatz und die Verwendung eines Sprachmodells 

(LM = Language Model) zur Auswahl von Aussprachevarianten in der Sprachsynthese zu einer höheren 

Akzeptanz im Bereich der Natürlichkeit (54% der Testbeispiele) und Spontanspachlichkeit (64% 

der Testbeispiele) führt. 

Weitere Untersuchungen haben aber auch ergeben, dass vor allem Wortübergänge falsch modelliert 

werden. Bisher wurde die Aussprachevariante nur anhand der Dauer ausgewählt. Es wird kein Wissen 

darüber verwendet, wie gut zwei ausgewählte Varianten zueinander passen oder nicht. Auch kann 

28

Forschung 

nicht jede Variante an jeder Stelle einer Äußerung stehen: z. B. kurze Aussprachevarianten sollten 

nicht als erste Silbe eines Satzes stehen oder zwischen zwei wichtigen Inhaltswörtern. 

Abbildung 14: Startseite der Dokumentation zu UASR. 

Um die Natürlichkeit der synthetisierten Aussprachevarianten weiter zu erhöhen und Wortübergänge 

besser modellieren zu können, wurde ein Varianten-Folgemodell trainiert. Der Einsatz dieses Folgenmodells 

zur Auswahl der Aussprachevariante erfolgte mittels des folgenden Algorithmus: 

(1) Berechnung der Sprachmodell-Wahrscheinlichkeit. 

(2) Berechnung der initialen relativen Wortdauern mittels der aus dem Sprachmodell bestimmten 

Wortfolgenwahrscheinlichkeit. 

(3) Rücksetzen der Akzentpunkte: Alle Wortdauern von Wörtern mit akzentuierten Silben werden 

auf 1 gesetzt. 

(4) Glättung der relativen Wortdauern. 

(5) Berechnung der Wortzieldauern aus den relativen Wortdauern. Eine relative Dauer von 1 entspricht 

dabei einer kanonischen Realisierung. 

(6) Erstellen eines Markov-Graphen für jede zu synthetisierende Äußerung. Jeder Knoten des 

Graphen steht dabei für eine Variante und ist mit einer eindimensionalen Gaußdichtefunktion 

gekoppelt, welche die Dauer dieser Variante beschreibt. Die Kanten des Graphen tragen Übergangsgewichte, 

welche mittels Varainten-Folgemodells bestimmt sind. 

(7) Suche des besten Pfades durch den Graphen und Auswahl der darauf liegenden Varianten. 

29

Forschung 

Die Auswahl der Aussprachevarianten mittels Markov-Graphen kann wie folgt dargestellt werden: 

Wenn { w1 o Lo 

w2} 

eine zu synthetisierende Wortfolge darstellt und A( 

wi 

) die Menge der Varianten 

des Wortes w , dann kann das Aussprachemodell G dieser Wortfolge wie folgt als stochastischer 

i 

Markov-Graph (SMG) ausgedrückt werden: 

{ { } } ) ( ) ( V E 

V , E, 

N , ν , 

G = 

π 

Dabei entspricht V der Knoten- und E der Kantenmenge. Die Menge { N } der eindimensionalen 

Gaußverteilungen wird durch ein Realignment abgeleitet und beschreibt die Dauer der Aussprachevarianten. 

( V ) 

Die Zuordnung : V → { N} 

E → ℜ 

ν weist jedem Knoten eine Gaußfunktion zu, wobei 

jeder Kante ein Übergangsgewicht zuweist. Die Knoten- und Kantenmengen werde wie folgt gebildet: 

U 

wi 

V = A( 

wi 

) und E = U A( 

wi 

) × A( 

wi−1 

) 

wi 

Jede Kante steht für einen Übergang von der Variante Α s (gekennzeichnet durch den Anfangsknoten 

vs ) zur Variante e (gekennzeichnet durch den Endknoten ). In Abbildung 15 ist ein Beispiel für 

ein Aussprache-SMG der Äußerung {morgens ○ zwischen ○ acht ○ und ○ neun} dargestellt. 

Α ve 

Abbildung 15: Stochastischer Markov-Graph (SMG) der Aussprachevarianten der Äußerung {morgens 

○ zwischen ○ acht ○ und ○ neun}. Knoten stellen Aussprachevarianten dar und Kanten enthalten 

die aus dem Aussprachesprachmodell ermittelten Gewichte. Der fett gezeichnete Pfad kennzeichnet 

den ausgewählten Pfad unter Beachtung des Varianten-Folgemodells. Dieses Beispiel zeigt die korrekte 

Berücksichtigung von Wortübergängen, z. B. Auslassung des /t/ und Angleichung des /s/ zwischen 

den ersten beiden Wörtern. Zum Vergleich zeigt der gestrichelte Pfad die Variantenauswahl nur 

unter Verwendung des kanonischen Sprachmodells und der Zieldauer. 

Wenn der Markov-Graph G erster Ordnung ist, dann ist 2 die maximale n-Gramm Ordnung, welche 

für das Übergangsgewicht verwendet wird. So werden die Kanten mittels Interpolation von Zero- 

Grammen, Uni-Grammen und Bi-Grammen wie folgt gewichtet: 

30 

( P( 

Α | Α ) ) = ln( 

f ⋅ P( 

Α | Α ) + f ⋅ P( 

Α ) + f ⋅ ) 

w vs 

, ve 

) ln e s 

2 e s 1 e 

( = P , 

0 

0 

π 

( E ) 

:

Forschung 

wobei , und die Gewichte der einzelnen n-Gramme und P die Zero-Gramm- Wahr- 

f 0 f1 f 2 

0 

scheinlichkeit kennzeichnen. 

Die Verwendung von SMG’s höherer Ordnung ist prinzipiell möglich, erfordert jedoch einen enormen 

Datenaufwand, um eine gesicherte statistische Aussage über mehrere aufeinander folgende Aussprachevarianten 

treffen zu können. 

Wenn die absolute Länge d i = d( 

wi 

) des Wortes wi 

einer zu synthetisierenden Äußerung gegeben 

ist, kann die optimale Folge der Aussprachevarianten als 

[ w( 

Α | Α ) + γ ln p( 

d | N ] 

arg max ∑ i i−1 

A∈G 

Αi∈A 

* 

A = 

) 

bestimmt werden, wobei w( Ai 

| Ai−1 

) das Kantengewicht des Überganges Ai− 1 o Ai 

und p( 

d i | N i ) 

die Wahrscheinlichkeitsdichte der gewünschten Wortlänge d (aus der Dauerstatistik der Aussprache- 

variante Α ) darstellt. Mit dem Skalierungsfaktor γ kann eingestellt werden, ob die gewünschte Wort- 

i 

länge oder die wahrscheinlichste Wortfolge stärker beachtet wird. 

Die Syntheseexperimente haben gezeigt, dass gegenüber der reinen Variantenauswahl mittel 

s„normalen“ Sprachmodell (vgl. Jahresbericht 2003) die zusätzliche Verwendung eines Aussprache- 

Sprachmodells eine bedeutende Steigerung der Spontanssprachlichkeit zur Folge hat, jedoch nur 

leichte Verbesserungen im Bereich der Natürlichkeit (vgl. Tabelle 1) bringt. 

Tabelle 1: Ergebnisse des Hörtests mittels Paarvergleich 

„Reine“ Varaintenauswahl 

i 

i 

i 

Variantenfolgemodell 

Verständlichkeit 15,8 % 22,3% 

Natürlichkeit 53,3 % 54,4 % 

Spontansprachlichkeit 64,6 % 73,7 % 

MOS (kanonisch: 3,21) 2,85 2,93 

Allerdings zeigen die Ergebnisse auch, dass die meisten Hörtestteilnehmer die kanonische Synthese 

als verständlicher bewertet haben. Beachtet man jedoch, dass jede über-artikulierte Ausspracheform 

in der Regel verständlicher ist als eine reduzierte Variante (auch bei natürlicher Sprache), so ist dieses 

Ergebnis nicht überraschend. 

Die Verwendung von Aussprachesprachmodellen erhöht nicht nur die Qualität der Sprachsynthese, 

sondern kann auch im Bereich der Spracherkennung Verbesserungen hervorrufen. Die Verwendung 

von Aussprachewörterbüchern in der Erkennung wird schon seit langem untersucht. Jedoch wurden 

nur Verbesserungen der Erkennungsrate erreicht, wenn durchschnittlich nur 1,1 bis 1,5 Varianten pro 

Wort verwendet wurden. Die Verwendung von mehr Varianten erhöht die Verwechslungswahrscheinlichkeit 

in der Art, dass die Erkennungsraten sinken. 

Das Wörterbuch für die Syntheseexperimente enthielt durchschnittlich 2,8 Varianten pro Wort, in früheren 

Experimenten haben wir sogar mit 3,7 Varianten pro Wort gearbeitet. Tabelle 2 zeigt, wie stark 

die Erkennungsraten sinken, wenn man ein kanonisches Wörterbuch durch ein solches Variantenwörterbuch 

ersetzt. Verwendet man nun statt des kanonischen Sprachmodells das Variantensprachmodell, 

so erhöht sich die Erkennungsrate wieder. Man erreicht aber noch nicht die Ergebnisse wie mit 

rein kanonischem Wörterbuch und Sprachmodell. Die Verwendung von Aussprachesprachmodellen in 

der Erkennung könnte aber ein Ausweg sein, wenn man auf die Verwendung von Variantenwörterbüchern 

angewiesen ist. 

Tabelle 2: Erkennungsergebnisse 

Setup Korrektheit 

Kanonisches Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 76,6 % 

Varianten-Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 61,8 % 

Varianten-Wörterbuch + Varianten Bi-Gramm Sprachmodell 68,8 % 

31

Forschung 

b) Methoden zur Verarbeitung von Finite State Machines 

Die auf STL basierende FSM-Bibliothek (C++) wurde in C umgeschrieben (neue dLabPro-Komponente) 

und erweitert, um mit dem Log-Semiring und Probability-Semiring arbeiten zu können. 

Weiterhin erfolgte eine Implementierung des „FSM Katz’ Back-Off“-Sprachmodells, die hier kurz erläutert 

werden soll. Ausgangspunkt ist, dass FSM-Sprachmodelle zwei Anforderungen erfüllen müssen: 

• Gewichtschätzungskorrektheit: Die Haupteigenschaft gewichteter FSM für Spracherkennungsaufgaben 

ist ihre Fähigkeit, Redundanz ohne Informationsverlust zu verringern. Damit diese Eigenschaft 

völlig ausgenutzt werden kann, sollten die Gewichte zweckmäßig berechnet werden, um 

sinnvolle Aussagen und Vergleiche zu ermöglichen. Diese Aufgabe fordert ein geeignetes 

Sprachmodell, das die korrekte Schätzung der Gewichte gewährleistet. 

• Pfadkontinuität: Die einfachste Art eines stochastischen Sprachmodels ist ein n-Gram, ein Modell, 

das eine natürliche Verkörperung eines FSMs erlaubt. Wenn ein Worthypothesen-FSM mit einem 

Sprachmodell-FSM komponiert wird, ergibt sich ein neues FSM, welches nur diejenigen Sätze aus 

der Worthypothese beinhaltet, die vom Sprachmodell akzeptiert wurden. Diese Prozedur hat den 

Hauptnachteil, dass keine korrekten Ergebnisse erzeugt werden, falls die Worthypothese die 

Wortsequenz w1-wn enthält, aber im Sprachmodell das n-gram wn| w1-wn-1 nicht existiert. 

Katz schlug eine Methode basierend auf der Arbeit von Good-Touring zur Schätzung von n-Gram- 

Wahrscheinlichkeiten vor, wenn diese wegen Mangels an Information nicht zur Verfügung stehen. 

Deshalb müssen nicht trainierte n-Grams wn| w1-wn-1 geschätzt werden, ohne dass die Suche durch 

das FSM-Sprachmodell unterbrochen wird. 

Die theoretische und praktische Implementierung des Katz-Sprachmodells in der Form eines FSMs 

wurde in einem Forschungsbericht ausführlich erklärt. 

Das Sprachmodell wurde anhand mehrerer Word-Lattice-Hypothesen geprüft, und erwartungsgemäß 

erhält das höchste Score diejenige Wortfolge, der die höchste Wahrscheinlichkeit im Sprachmodell 

zugewiesen wurde, was letztendlich vom Trainingskorpus abhängt. Die Abbildungen 16 bis 18 schildern 

ein einfaches Beispiel für die Worthypothese H1, “D A B”, ein FSM-Katz-Sprachmodell für den 

Satz „A B C D“ und den Suchpfad (Strichlinie). Die Wahrscheinlichkeit des Satzes “D A B.” ist das 

Produkt aller Kantengewichte. 

32 

s 

P(“D A B.”) = αs * PGT(D) * αD * PGT (A) * PGT (B|A) * αAB * αB * PGT (.) 

A 

A/PGT(A) 

φ/αs 

NH 

0 

D / 1 A / 1 B / 1 . / 1 

1 2 3 

4 

Abbildung 16: Worthypothese H1. 

C D 

sAB ABC BCD 

B C 

φ 

sA AB BC CD 

φ 

B/PGT(B|A) 

φ/αAB 

C 

φ 

D 

φ 

A B C 

φ 

φ/αB 

B 

φ 

D/PGT(D) 

C 

φ 

φ/αD 

D 

D 

. 

. 

. /PGT(.) 

Abbildung 17 Die Strichlinie zeigt Back-Off-Komposition zwischen 

H1 und dem grau gefärbten Sprachmodell. 

. 

END

S 

Forschung 

D/αs ε/PGT(D) A/αD ε/PGT(A) B/PGT(B|A) ./αAB ε/αB ε /PGT(.) 

NH 

D NH 

A 

AB B NH 

END 

Abbildung 18 Resultierendes FSM nach der Back-Off-Komposition. 

c) Stimmaktivierung eines Spracherkenners 

Die Aktivierung eines Spracherkenners stellt einen kritischen Faktor für den praktischen Einsatz von 

Sprachtechnologien dar. Aktuelle Systeme erfordern meist eine manuelle Bedienung per Tastendruck 

(„push-to-talk“) zum Freischalten des Erkenners. Für viele Anwendungen stellt die Aktivierung per 

Sprache eine sinnvolle Alternative dar. Bei der Stimmaktivierung kommen als Schlüsselwörter oft exotische 

Ansprechwörter zum Einsatz, welche in normaler Unterhaltungssprache sehr selten auftreten. 

Dies soll irrtümliche Aktivierungen des Erkenners vermeiden. Unter dem Blickwinkel der Benutzerakzeptanz 

sind solche exotischen Schlüsselwörter jedoch kritisch zu betrachten. In aktuellen Stimmaktivierungssystemen 

finden prosodische Faktoren wie die Stimmmelodie, die Intensität oder die Wort- 

bzw. Silbendauer kaum Beachtung. Man kann jedoch experimentell zeigen, dass Benutzer beim Ansprechen 

eines Sprachdialogsystems das entsprechende Schlüsselwort besonders betonen (siehe 

Abbildung 19). Daher haben wir ein Verfahren zur Integration prosodischer Merkmale in die Schlüsselworterkennung 

zur Stimmaktivierung entwickelt [5]. Die primäre Zielsetzung bestand in einer Verbesserung 

der Robustheit der Stimmaktivierung bei gleichzeitigem Verzicht auf exotische Schlüsselwörter. 

Es wurde experimentell untersucht, inwiefern prosodische Merkmale dazu beitragen können, 

das Auftreten eines bestimmten Schlüsselworts beim Ansprechen des Erkenners vom Auftreten desselben 

Wortes innerhalb normaler Unterhaltungssprache zu unterscheiden. 

normalized F 0 

k O m p j u: t E 6 label 

Abbildung 19: F0 Konturen des Schlüsselwortes „Computer“ aus Kommandophrasen (command) und 

normaler Sprache (non-command). 

Zur Modellierung der prosodischen Merkmale des Ansprechwortes wurde ein auf den Grundfrequenz- 

und Intensitätsverlauf trainiertes Hidden-Markov-Modell in einen Kommandoerkenner integriert (siehe 

Abbildung 20). Die prosodische Erkennungsleistung des erstellten Modells wurde mit den Erkennungsresultaten 

von menschlichen Versuchspersonen in einem Hörtest verglichen. Für eine identische 

Aufgabenstellung erreichte das trainierte Modell mit einer Erkennungsrate von 74,2% bei einer 

Fehlalarmrate (irrtümliche Aktivierung) von 25,5% nur geringfügig schlechtere Ergebnisse als die 

menschlichen Versuchspersonen. Diese erzielten eine mittlere Erkennungsrate von 81% bei einer 

Fehlalarmrate von 29%. Durch die Integration des prosodischen Modells in die Kommandoerkennung 

erfolgte eine zusätzliche Verifikation der Schlüsselworthypothesen des phonetischen Erkenners. Als 

Resultat dieser Überprüfung konnte die Equal Error Rate (gleiche Anzahl von Fehlaktivierungen und 

Fehlrückweisungen) von 13,1% auf 6,9% verringert werden. Die Kommandoerkennungsrate wurde im 

Experiment gleichzeitig von 85,1% auf 91,4% gesteigert. Durch eine alternative Rückweisungsstrategie, 

basierend auf einer Abstandsklassifikation der Konfidenzmaße, konnte die Erkennungsrate weiter 

auf 93,6% erhöht und die Anzahl der Fehlaktivierungen auf 2,2% reduziert werden. 

time 

33

Forschung 

Abbildung 20: Blockschaltbild des Spracherkenners, bestehend aus drei wesentlichen Bestandteilen: 

Kompilation des Erkennungsnetzwerks, Spracherkenner und Referenzerkenner (freie Phonemerkennung) 

zur Berechnung von Konfidenzwerten und zur Rückweisung. Die grau hinterlegten Bereiche 

markieren die prosodische Schlüsselwortverifikation 

d) Prosodie-Komponente von UASR 

Von den Komponenten von UASR ist bisher die Implementierung der prosodischen „Klammer“, die 

sich um den Analyse- und Synthesezweig legt, am wenigsten fortgeschritten. Die besonders durch die 

Entwicklung von DRESS vorliegenden Erfahrungen sollen im Rahmen des Promotionsvorhabens von 

Herrn Oba hier einfließen. Im Berichtsjahr konzentrierte er sich besonders auf den Zusammenhang 

von Dialekt und Intonation und führte dazu vergleichende Untersuchungen anhand des Verbmobil- 

Korpus durch. Die vorläufigen Ergebnisse wurden zum Prager Workshop veröffentlicht [6]. 

e) UASR-Resynthese-Experimente 

Die UASR-Architektur ermöglicht die Resynthese von einem erkannten Sprachsignal, dessen Fehler 

akustisch erkannt werden können, was ein zusätzliches Werkzeug zur Fehleridentifizierung darstellt. 

Anhand dieses Konzepts wurden die ersten Blöcke unseres experimentellen Systems untersucht. 

34

Forschung 

Abbildung 21 stellt den Signalfluss vom Sprachsignal zum Laut sowie das entsprechende synthetisierte 

akustische Signal in jedem Zwischenschritt dar. 

Abbildung 21: Signalfluss Resynthese. 

Das Experiment bewies, dass kein wahrnehmbarer Informationsverlust nach der Merkmalextraktion 

und Merkmalraumreduktion (Cepstrum analysis and PCA) stattfand. 

Die Verständlichkeit des Sprachsignals nach der Vektorquantizierung verschlechtert sich drastisch, 

denn die trainierten Phonemmodelle sind nicht akkurat genug. Ein zusätzliches Problem tritt auf wenn 

die erkannten Phoneme synthetisiert werden, da die Pitch-Information (Tonhöhe) an die neuen Merkmale 

angepasst werden soll. 

Ein weiteres Problem ist die Tatsache, dass die Pitch-Information nach der Merkmalextraktion nicht 

mehr zur Verfügung steht. Deshalb muss sie künstlich hinzugefügt werden, was die Fehleridentifizierung 

in gewissem Maße in einen subjektiven Prozess verwandelt. 

Zum Thema „Fehleranalyse von Phonemhypothesengraphen“ wurde eine Studienarbeit angefertigt 

[7]. 

f) Anwendung auf nichtsprachliche Signale I: Qualitätsbewertung technischer Prozesse 

Das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer 

Prozesse“ wurde im Dezember 2003 bewilligt. Dieses Projekt wird gemeinsam mit dem Fraunhofer 

Institut für Zerstörungsfreie Prüfverfahren (IZFP-D) Dresden bearbeitet. Dabei werden von technischen 

Prozessen stammende Signale klassifiziert. 

Klassifikationsverfahren 

Das entwickelte Klassifikationsverfahren beruht auf Algorithmen der Folgenklassifikation sowie Methoden 

zur Strukturaufdeckung, also zum automatischen Lernen von endlichen Zustandsautomaten. 

Abbildung 22 zeigt ein Konzept für das Verfahren. Zur Merkmalextraktion wurde die Spektraltransformation 

verwendet. Die Merkmalkompression erfolgte durch Zusammenfassen von Vektorkomponenten 

sowie durch lineare Transformationen (Karhunen-Loeve-Transformation). Das akustische Modell 

wurde durch ein SMG-Modell (Stochastischer Markov-Graph 1. Ordnung) realisiert. 

35

Forschung 

Abbildung 22: Konzept für ein Folgenklassifikationsverfahren für technische Signale mit den folgenden 

wesentlichen Bausteinen: Merkmalextraktion, Klassifikation durch ein akustisches Modell, Selbstkontrolle 

der Klassifikation durch Auswertung eines Konfidenzmaßes, bei Rückweisung manuelle 

Klassifikation und Nachtraining. Der Arbeitspunkt der Selbstkontrolle wird als angemessener Kompromiss 

zwischen Fehlrückweisungs- und Fehlakzeptanzrate (FAR/FRR) gewählt. 

Methoden für das automatische Anlernen 

Ein weiterer Schwerpunkt des Projekts liegt auf der Erforschung und Entwicklung von datengetriebenen 

Trainingsmethoden. Alle Wissensquellen des Klassifikators sollen automatisch durch Anlernen mit 

einer (von Hand) klassifizierten, möglichst kleinen Trainingsstichprobe aufgebaut werden. 

Für den Klassifikator wurden folgende Wissensquellen trainiert: 

• die Merkmalstatistik und daraus abgeleitete Eigenvektormatrix für die Merkmaltransformation, 

• die Struktur der endlichen Zustandsautomaten des akustischen Modells, 

• die Emissionsverteilungsdichten des akustischen Modells sowie 

• ggf. Rückweisungsschwellwerte. 

36

Forschung 

Der Schwerpunkt für die Erforschung der Trainingsmethoden lag auf der automatischen Strukturaufdeckung, 

da hier das größte zusätzliche Potential im Vergleich mit herkömmlichen Klassifikationsmethoden 

erwartet wurde. 

Abbildung 23 zeigt ein erstes Konzept für ein mögliches Trainingsverfahren, welches an Prinzipien der 

Klassifikation von Sprachsignalen angelehnt ist. 

Lernstichprobe 

Signal Klassen 

Merkmalextraktion 

Merkmalvektoren 

Merkmalkompression 

Merkmalvektoren 

Viterbi 

Training 

Modellversäuberung 

Merkmalstatistik 

Modellinitialisierung 

Weltmodell 

Akustisches 

akustisches 

Modell 

Klassenmodelle 

Gaußmodelle 

teilen 




(klassenabhänige) 

Statistik 


Reklassifikation 

Abbildung 23: Konzept für ein vollautomatisches, datengetriebenes Training für die Klassifikation 

technischer akustischer Signale 

Experimente 

Bereits im Jahresbericht 2003 wurden die ersten durchgeführten Fallbeispiele zur Eignung der Folgenklassifikation 

für technische Signale beschrieben. 

In diesem Jahr lag der Schwerpunkt der Anwendungen auf mikrofluidischen Bauelementen. Die Prüfaufgaben 

dabei bestanden neben der Unterscheidung zwischen neuwertigen und gebrauchten Baulelementen 

in der Durchführung einer Lebensdaueranalyse mit dem Ziel, einen bevorstehenden Ausfall 

rechtzeitig zu erkennen. Die Untersuchungen wurden in Form eines Dauerversuches durchgeführt, bei 

dem Ventile zyklisch geöffnet und geschlossen wurden. Die Signale während des Schließvorganges 

wurden aufgezeichnet und mittels UASR klassifiziert. Zu diesem Zwecke wurden verschiedene akustische 

Modelle entsprechend des Lebensalters der Ventile angelernt. Das Anlernen erfolgte über n 

Ventile, wobei es galt, das (n+1)-te Ventil mittels der trainierten Modelle zu klassifizieren bzw. dessen 

Zustand möglichst genau zu analysieren. 

Zum Training jedes Klassenmodells wurden jeweils 1000 Daten verwendet. Verschiedene Modelle 

wurden gebildet: 

− Neu (Modell aus neuwertigen Ventilen) 

− Mittel (Modell aus Ventilen mittlerer Lebenszeit) 

− Alt (Modell aus alten Ventilen) 

37

Forschung 

Im folgenden Beispiel (Abbildung 24) wurden die Trainingsmodelle aus Daten der Ventile 2 und 3 gebildet, 

klassifiziert wurde Ventil 5. Dargestellt sind die Modelle Alt und Neu sowie die Differenz aus Alt 

und Neu, das die beste Tendenzanzeige lieferte. 

Abbildung 24: Beispiel – Akustische Lebensdaueranalyse von Ventilen. 

g) Erkennung nichtsprachlicher Objekte II: Nichtinvasive Blutdruckmessung am aktiven Menschen 

Ein besonderes Problem bei der messtechnischen Erfassung von Blutdruckwerten stellen Messungen 

am aktiven Probanden dar. Als Messverfahren sollte die akustische Auswertung der sogenannten 

Korotkow-Geräusche verwendet werden, worauf üblicherweise die „klassische“ Blutdruckmessung in 

der Alltagsmedizin beruht. Durch eine geeignete Messanordnung und nachfolgende Signalverarbeitung 

bzw. –auswertung soll dieses Verfahren auch für die Blutdruckmessung am aktiven Menschen, 

d. h. unter gestörten Bedingungen, eingesetzt werden. 

Auf Grund des Charakters der Störkomponenten scheinen einfachere Detektionsalgorithmen für die 

beiden Messzeitpunkte Anfang und Ende des Korotkow-Geräuschs wenig aussichtsreich. Aus diesem 

Grund wurde auf einen Mustererkennungsansatz orientiert, wie er z. B. im Bereich der automatischen 

Spracherkennung für die Detektion von bestimmten Schlüsselwörtern in Wortketten verwendet wird. 

Als Merkmale kommen spektrale Koeffizienten zum Einsatz (256-Punkte-Fast-Fouriertransformation, 

Fortsetzrate: 128 Abtastwerte), die vom amplitudennormierten Messsignal berechnet werden. In einer 

Merkmalauswahlstufe wird die Anzahl der Koeffizienten auf 9 logarithmierte reduziert. Der Merkmalsatz 

wurde durch Delta- und Delta-Delta-Koeffizienten und die mittlere Signalenergie komplettiert. 

Der Vergleichsalgorithmus beruht auf einem Abstandsfolgenklassifikator (euklidischer Abstand), der in 

seinen Randbedingungen an die vorliegende Aufgabe angepasst wurde. 

In der Vergleichsstufe wurde nun für jedes Messsignal das aus dem jeweils ungestörten Signal manuell 

extrahierte Korotkow-Geräusch mit Hilfe der oben angeführten Klassifikationsstrategie im gestörten 

Signal gesucht und entsprechend Anfangs- und Endpunkt detektiert. 

Unter Vernachlässigung der offensichtlich durch grobe Messfehler beeinträchtigten Messsignale in der 

vorliegenden Stichprobe wurden mit dem beschriebenen Mustererkennungsansatz ca. 60 % Signaldetektion 

erreicht (156 Messsignale). Das Ergebnis kann verbessert werden, wenn das sehr „harte“ 

Klassifikationskriterium (Summe der Abweichungen von absoluter Anfangs- und Endposition des 

Korotkow-Geräuschs) dahingehend verändert wird, dass die relativen Positionen zueinander stärker 

bewertet werden. 

38

Forschung 

Abbildung 25 zeigt die Abhängigkeit der Detektionsrate vom Klassifikationskriterium (Summe der Abweichungen 

von detektiertem Anfangs- und Endpunkt des Korotkowgeräuschs in mmHg). 

Literatur zu 3.2.1 

Abbildung 25: Klassifikationsergebnis in Abhängigkeit vom Klassifikationskriterium. 

[1] R. Hoffmann, M. Eichner, S. Werner, and M. Wolff, „The Project UASR (Unified Approach for 

Speech Synthesis and Recognition) – A Progress Report“, Proc. Speech Processing Workshop, 

DAGM 2003, Magdeburg, Germany, p. 17-24. 

[2] M. Eichner, M. Wolff and R. Hoffmann, „Voice characteristics conversion for TTS using reverse 

VTLN“, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 17-20 , 2004. 

[3] S. Werner, M. Eichner, M. Wolff and R. Hoffmann, „Modelling Pronunciation Variation for 

Spontaneous Speech Synthesis “, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 673-676 , 

2004. 

[4] C. Tschöpe, D. Hentschel, M. Wolff, M. Eichner and R. Hoffmann, „Classification of non-speech 

acoustic signals using structure models“, Proc. ICASSP 2004, Montreal, Canada, Vol. 5 , pp. 653- 

656, 2004. 

[5] M. Kühne, M. Wolff, M. Eichner and R. Hoffmann, „Voice activation based on prosodic keyword 

verification”, Proc. INTERSPEECH, Jeju, South Korea, 2004. 

[6] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop Speech 

Processing, September 13 – 15, 2004, Prague, 12 – 15. 

[7] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen. Studienarbeit TU Dresden 

2004. 

3.2.3 Sprachsynthese 

a) Grundlagenforschung Prosodie – Optimierung des Integrierten Modells 

In den Jahresberichten 2002 und 2003 wurde das Integrierte Prosodiemodell des Deutschen (IGM) 

vorgestellt. Es arbeitet NN-trainingsbasiert und generiert Fujisaki-Ansteuerparameter zur Erzeugung 

der Grundfrequenzkontur, Silben- und Pausendauern sowie Intensitätsverläufe. Das IGM kann mit 

verschieden Sprecher- und Sprechstildaten trainiert werden. Die Anwendbarkeit auf andere Sprachen 

wurde nachgewiesen. 

Im Zuge der weiteren Optimierung des Ansatzes wurden die einzelnen Parameter (wie z. B. die 

Sprechintensität, vgl. Jahresbericht 2003) genauer untersucht. Es wurden folgende Ansatzpunkte für 

eine Optimierung des IGM identifiziert: 

39

Verringerung des MSE gegenüber MFN (%) _ 

40 

35 

30 

25 

20 

15 

10 

5 

0 

-5 

-10 

Weglassen außerhalb von |3S| 

ein Eingang |3S| 

zwei Eingänge ±3S 

Forschung 

AA T1_DI T2_DI AP_L DIST_ PAUSE DUR ENERG 

Untersuchter Parameter 

Abbildung 26: Automatische Markierung von Extremwert-Daten. 

• Berücksichtigung zusätzlicher Eingangsinformation: Das Modell berücksichtigte z. B. keine Elemente 

von Bedeutung, semantic focus oder abgeleitete Merkmale. 

• Strukturoptimierung des Neuronalen Netzwerkes: Die neuronale Struktur des Netzwerkkerns 

des IGM wurde entsprechend den Erfahrungen mit ähnlichen Prediktionsaufgaben implementiert. 

Ein evolutionärer Algorithmus soll Redundanzen in der Topologie reduzieren und die 

Signifikanz verbleibender Neuronen, Eingangsmerkmale, etc. in weiteren Trainingszyklen erhöhen. 

• Verringerung der Rechenkomplexität bzw. des Speicherverbrauchs: IGM konnte nicht in einem 

Embedded Text-to-Speech (TTS-)System implementiert werden. 

Zusätzliche Qualifizierung der IGM-Eingangsmerkmale (Ergebnisse) 

Eine semantische Erweiterung der Eingangsmerkmale des IGM ist in der Praxis kompliziert, da die 

entsprechenden Informationen nicht nur in der Trainingsdatenbasis zuverlässig markiert werden, sondern 

auch während der Kannphase im TTS-System vorliegen müssen. 

Als Zwischenschritt wurde getestet, welchen Einfluss die automatische Markierung von extremen Werten 

eines bestimmten Ausgabeparameters auf das Netztraining hat. Für jeden Ausgabeparameter 

wurde ein separates neuronales Netz trainiert. Dabei wurden je Parameter vier Konfigurationen untersucht: 

• Verwendung des ursprünglichen MFN ohne Änderungen (MFN), 

• Eliminierung aller Datensätze aus Trainings- und Testmenge, bei denen der Parameter außerhalb 

eines Vielfachen n der Standardabweichung S liegt (Weglassen > |nS|), 

• Ein zusätzlicher Eingang, ob der Parameter außerhalb eines bestimmten Vielfachen n der 

Standardabweichung liegt (ein Eingang > |nS|), 

• Zwei zusätzliche Eingänge, ob der Parameter positiv oder negativ außerhalb eines bestimmten 

Vielfachen der Standardabweichung liegt (zwei Eingänge, > +nS / < -nS). 

Das Training wurde mit Markierungen für die ein- bis dreifache Standardabweichung durchgeführt. 

Abbildung 26 zeigt die Ergebnisse für die dreifache Streuung. Bis auf einige Ausreißer beim Training 

ist gut zu erkennen, dass alle drei Konfigurationen ähnliche Verbesserungen der Prediktion nach sich 

ziehen. Besonders markant ist diese Beobachtung bei den zeitlichen Parametern T1, DIST (T0) bzw. 

PAUSE, wo sich der Fehler (MSE) um ca. 20% bis 30% reduziert. In Zusammenhang mit der geringen 

Anzahl an Datensätzen, welche dabei markiert werden mussten, ist zu vermuten, dass diese Extremwerte 

teilweise auf Label-Ungenauigkeiten in der Datenbasis zurückzuführen sind. 

40

Forschung 

Evolutionäre Topologieoptimierung des neuronalen Netzwerkkerns von IGM 

Evolutionäre Algorithmen (EA) sind Methoden zur stochastischen Optimierung, welchen den natürlichen 

Prozess von Evolution, Selektion und Variation simulieren. Aufgrund mehrerer Optimierungsparameter 

(multikriterielles Optimierungsproblem) sowie der Topologie des IGM fiel die Wahl auf den 

Strength Pareto Evolutionary Algorithm (SPEA). 

Die Struktur eines neuronalen Netzes ist durch zwei Extreme begrenzt: Auf der einen Seite kann das 

RMSE _ 

0,175 

0,165 

0,155 

0,145 

0,135 

0,125 

1 3 5 7 9 11 13 15 17 19 21 23 

Netz so klein sein, dass es unfähig ist, alle Trainingsmuster und die darin liegenden Zusammenhänge 

vollständig zu lernen, auf der anderen Seite kann es zu groß sein, um die angebotenen Daten zu generalisieren 

und wird jeden Datensatz einzeln lernen. Durch die Nutzung von EA sollten folgenden 

Optimierungsziele erreicht werden: 

Anzahl Eingänge 

Mittelwert-Modell 

Originalnetz 

Abbildung 27: Optimierungsdurchläufe im Vergleich 

zur ursprünglichen Netzleistung. 

� Minimierung des mittleren quadratischen Fehlers (MSE bzw. RMSE), 

� Minimierung der Anzahl der Verbindungen, 

� Minimierung der Anzahl der Eingänge, 

� Minimierung der Anzahl der verdeckten Knoten. 

Das ursprüngliche MFN besteht aus 24 Eingängen, 744 Verbindungen, 30 verdeckten Knoten und 8 

Ausgängen. Der minimal beobachtete Overall-RMSE nach dem Training beträgt 0.139. 

Zwei größere Konfigurationen (mit 40 und 50 verdeckten Knoten) verhalten sich ähnlich wie das ursprüngliche 

Netz. Die Verwendung von SPEA zur Reduktion der generellen Netzwerk-Topologie durch 

Löschen von Knoten bzw. Verbindungen (wobei nach jedem Durchlauf ein erneutes MFN-Training 

mittels Backpropagation erfolgt) zeigt ebenfalls keine signifikante Änderung des resultierenden RMSE. 

Unter Berücksichtigung mehrstündiger Evolutionsdurchläufe wurde das Experiment nach einigen hundert 

Iterationen beendet. 

Eine Reduktion der Eingangsanzahl mittels SPEA zeigt die beabsichtigte Wirkung. Ein optimiertes 

Netzwerk mit nur sechs Eingangsparametern verursacht eine RMSE-Erhöhung von lediglich 4.4% 

gegenüber dem Originalnetz (Abbildung 27). Frühere Korrelationsanalysen bestätigen, dass ca. 80 bis 

95% der Vorhersageleistung von nur 5-8 Eingabeparametern abhängen. Subjektive Tests zeigen keine 

hörbaren Unterschiede zwischen den optimierten bzw. den ursprünglich geschätzten Grundfrequenz- 

und Dauerverläufen. 

41

Inkonsistenz von Trainingsdaten 

Forschung 

Ein weiteres evolutionäres Experiment beschäftigte sich mit der korrekten Auswahl von Trainings- und 

Testmustern. Während des ursprünglichen Trainings des IGM wurden die Aufnahmebedingungen des 

verwendeten Teils des Stuttgarter Nachrichtenkorpus als konstant angenommen. Da die SPEA jedoch 

eine spezifische Vorliebe für bestimmte Trainings- und Testmengen-Kombinationen aufzeigte, wurden 

Inkonsistenzen in den Trainingsdaten entdeckt – wie z. B. unterschiedliche RMS-Signalwerte, welche 

beispielsweise durch unterschiedliche Normierungen, wechselnde Aufnahmetechnik oder unterschiedliche 

Sprecher bzw. Sprechstile hervorgerufen werden können. 

Zusammenfassend wird eingeschätzt, dass die Datenabhängigkeit trainingsbasierter Prosodiemodelle 

generell stärker ist - als in früheren Arbeiten angenommen. Die algorithmische bzw. strukturelle Modellierung 

ist anscheinend in gewissen Grenzen flexibel. 

Literatur: 

O. Jokisch, M. Hofmann, Evolutionary Optimization of an Adaptive Prosody Model, Proc. 

INTERSPEECH (ICSLP), 797-800, Jeju, Korea, 2004. 

O. Jokisch, M. Hofmann, Optimierung einer trainingsbasierten Prosodiegenerierung für Sprachsynthese, 

Elektronische Sprachsignalverarb. (Proc. ESSV), 175-182, Cottbus, 2004. 

b) Sprachübergreifende Studie zu Glottalisierungseffekten 

Die Motivation der Studie ergibt sich aus der notwendigen Selektion von Inventarsprechern, z. B. für 

die Sprache Mandarin-Chinesisch sowie die Designunterschiede im Vergleich zu geeigneten Phonem- 

bzw. Diphontabellen für die Sprachen Englisch und Deutsch. 

Eine Glottalisierung ist eine Diskontinuität bzgl. der Periodizität des Sprachsignals, welche die Qualität 

konkatenativer Sprachsynthese während der Grundfrequenzmanipulation verschlechtern kann. Relevant 

sind Systematik und Position möglicher Glottalisierungen in verschiedenen Sprachen als auch 

geeignete Manipulationsalgorithmen. 

Das verwendete Sprachdatenmaterial umfasst Texte sowie isolierte Silben von acht Mandarin- 

Muttersprachlern, Texte von je 6 Muttersprachlern US- bzw. UK-Englisch und Texte zweier deutscher 

Sprecher. Weiterhin wurden Diphoninventare für US, UK und Deutsch untersucht. 

Amount 

150 

100 

50 

0 

� � � � � � 

� ßÞ � 

Á×ÓÐ�Ø�� ËÝÐÐ��Ð� 

� ßÞ � 

Ì�ÜØ 

Non-Tone3 

Voiceless 

glottal. 

normal 

Speaker 

Abbildung 28: Häufigkeit von Ton3-Varianten für acht Mandarin- 

Sprecher. Menge „Non-Tone3“ umfasst fehlerhafte Artikulationen. 

Zusammenfassend ergaben sich folgende Resultate: 

• Glottalisierungen sind generell schwer vorhersagbar und idiosynkratisch für bestimmte Äußerungen 

oder Sprecher. 

• Sie sind sprecherabhängig und erscheinen häufig an initialen und manchmal an wort-finalen 

Vokalen in allen genannten Sprachen. 

• In Mandarin treten Glottalisierungen häufig im Zentrum des Tons 3 und manchmal am Ende 

des Tons 4 auf (tiefere Grundfrequenzpositionen), vgl. auch Abbildung 28. 

• Die Auftretenswahrscheinlichkeit an silben-initialen Vokalen ist in Deutsch größer als in Englisch, 

aufgrund der speziellen Silbenstruktur des Deutschen. 

42

Forschung 

Die Autoren schlagen eine differenzierte Behandlung der Glottalisierung in jeder Sprache vor. Solange 

der Inventarsprecher in seinen Trägerwörtern keine oder wenige Glottalisierungen generiert, erscheint 

es unnötig, separate Phoneme für Glottalisierung oder Glottisverschluss zu definieren. Für deutsche 

Sprachsynthese sollte Glottalisierung jedoch Phonemstatus erhalten und bei der Inventaraufnahme 

entsprechend provoziert werden. Betrachtet man die Vielfalt natürlicher Sprache und möchte verschiedene 

Sprecher, Sprechstile oder ggf. Emotionen synthetisieren, sollte Glottalisierung allerdings 

generell modelliert werden. 

Literatur: 

H. Ding, O. Jokisch, R. Hoffmann, Glottalization in Inventory Construction: A Cross-Language Study, 

Proc. ISCSLP, 37-40, Hongkong, 2004. 

c) Entwicklungsarbeiten zur Embedded-Sprachsynthese 

Sprachsynthese mit geringem Speicherbedarf stellt weiterhin eine Hauptforschungs- und Entwicklungsrichtung 

am Institut dar. Die entsprechenden Arbeiten zum TTS-System microDRESS und die 

Siemenskooperation bei der Entwicklung des Systems Papageno Embedded wurden bereits in den 

Jahresberichten 2002 und 2003 ausführlich beschrieben. Ein entsprechendes Produkt für Deutsch 

und US-Englisch wird derzeit vermarktet. 

Die Arbeiten im Kalenderjahr 2004 konzentrierten sich auf zwei Bereiche: 

• Weiterentwicklung der Kerntechnologie: Inventarkodierung und akustische Synthese, 

• Konzeption und Entwicklung weiterer Sprachressourcen (Projekt „New Languages“). 

Die Entwicklung der Kerntechnologie läuft synchron zur TUD-eigenen Forschung und wird im folgenden 

Abschnitt d) beschrieben. Es entstand u. a. eine neuartige Synthesemethode (DFI-SS), die zur 

Patentierung angemeldet wurde und eine interessante Alternative, z. B. zu PSOLA, darstellt. 

Im Folgenden werden die Arbeiten des Projekts „New Languages for Papageno“ dargestellt. Neben 

den Stammmitarbeitern der Sprachsynthese wurden diese Arbeiten durch ein Team von Muttersprachlern 

(beratende Linguisten und Sprachlehrer, Diplomanden, etc.) durchgeführt. 

Datenbasenkonzept, Sprecherauswahl 

Das bereits für microDRESS realisierte Synthesekonzept sieht eine strikte Code-Daten-Trennung vor. 

Der akustische Modul ist trotz seiner algorithmischen Effizienz flexibel bezüglich der Basiseinheiten 

(Diphon, Silbe, etc.) und ermöglicht auch die Selektion aus Varianten (Korpussynthese). 

Bei der Integration neuer Sprachen bzw. neuer Sprecherdatenbasen waren allerdings dennoch bestimmte 

sprach- oder sprecherspezifische Merkmale zu beachten, u. a.: 

• Vorverarbeitungskonforme Phonem- bzw. Diphonsets: Je nach verwendeten Algorithmen/ Lexika 

variierten die Spezifikationen (SAMPA, X-SAMPA, TUD, SIEMENS-CT), 

• Eignung des Inventarsprechers für die verwendete Inventarkodierung (z. B. AMRWB) bzw. die 

Synthesemethode (z. B. PCM/ TD-PSOLA, DFI-SS, etc.), 

• ggf. Berücksichtigung von Glottalisierungseffekten. 

Die Sprecherauswahl wurde auf Basis von Hörtests objektiviert, wobei sprachenabhängig 5-8 Sprecherinnen 

(Rundfunkmedien, Linguistik, Lehrer, Studenten) zur Auswahl standen. Die Bewertung erfolgte 

auf Basis von bis zu 6 Beispielphrasen und wurde sowohl von jeweils 20 Muttersprachlern als 

auch von Expertenhörern aus der Sprachtechnologie (TUD und Siemens) durchgeführt. 

Interessanterweise wurden teilweise (z. B. Französisch oder Niederländisch) nicht die „professionellsten 

Stimmen“ ausgewählt, was in gewissem Widerspruch zur üblichen subjektiven Sprecherauswahl 

steht. Außerdem hatte das Kodierungsverfahren einen teilweise wesentlichen Einfluss auf Stimmpräferenzen 

bzw. verringerte manchmal die Signifikanz der Auswahl (Unterschiedliche Bewertungen wurden 

stark nivelliert, d. h. die Sprachqualität hing v. a. vom Kodierungsverfahren ab, obwohl z. B. das 

AMRWB-Verfahren bezüglich Standardbewertungen (wie MOS) sehr gut abschneidet. 

Ebenfalls überraschend war die Tatsache, dass Expertenurteile in der Regel gut mit Muttersprachlerurteilen 

korrelieren, auch wenn die Sprachkenntnis nicht oder nur beschränkt vorhanden war. 

43

Forschung 

Literatur: 

O. Jokisch, G. Strecha, H. Ding: Multilingual Speaker Selection for Creating a Speech Synthesis 

Database, Proc. AST Workshop, Maribor, Slovenia, 2004 (in press). 

Generierung von Sprechertexten, Studioaufnahmen 

Um die Generierung von neuen Sprachressourcen zu beschleunigen, wurden mehrere neue Tools 

entwickelt, welche im Wesentlichen die vorverarbeitungskonforme Definition von Phonem- bzw. 

Diphontabellen und die automatische Bereitstellung von Sprechtexten (z. B. Trägerwörter) betreffen 

wie z. B. das Programm lex2diph. Der manuelle Bearbeitungsaufwand konnte erheblich reduziert werden. 

Die umfangreichen Sprachaufnahmen wurden entsprechend dem Stand der Technik im Studio des 

IAS durchgeführt (Grossmembran-Mikrofon, Laryngograph, Recordingsoftware), wobei neben der 

Sprecherin jeweils ein Techniker und ein linguistisch-phonetisch vorgebildeter Muttersprachler anwesend 

war, um die Qualitätsanforderungen sicherzustellen. 

Neben dem Basismaterial für die Inventarerstellung (jeweils mehrere tausend Wörter) wurde je Sprache 

zusätzlich ein Prosodiekorpus von 1.000-1.300 Phrasen aufgenommen und segmentiert, welcher 

für das Training der entsprechenden Prosodiemodelle genutzt wird. 

Sprachdatenbearbeitung und Inventargenerierung 

Die notwendigen automatischen und manuellen Arbeiten zur Sprachdatenbearbeitung wie Segmentierung/ 

Labeln, Periodenmarkierung, iterative Optimierung wurden bereits in früheren Jahresberichten 

beschrieben, laufen weitestgehend standardisiert ab und stellen keine Forschung oder Entwicklung im 

eigentlichen Sinne dar. 

Trotz verbesserter Technologie, z. B. Phoneme Aligner, ist der manuelle Aufwand nach wie vor vergleichsweise 

hoch, um sprach übergreifend Inventare mit hoher und vor allem uniformer, akustischer 

Qualität zu generieren. Der iterative Optimierungsprozess nimmt ca. 2-3 Personenmonate in Anspruch. 

Neben den bereits realisierten Datenbasen für Deutsch und US-Englisch wurden am IAS im Jahr 2004 

weibliche Syntheseinventare für folgende Sprachen entwickelt und fertig gestellt: UK-Englisch, Kastellan-Spanisch 

sowie Italienisch. Derzeit befindet sich ein niederländisches Inventar in der Entwicklung. 

In Kooperation mit der voiceINTERconnect Dresden GmbH entstand außerdem ein französisches 

Syntheseinventar. 

Alle Inventare erfüllen die microDRESS- bzw. Papageno Embedded-Spezifikation und benötigen je 

nach Sprache, Qualitätsstufe und Kodierung nur 220 bis 1.100 kB Speicher. 

d) AMR-WB-basierte akustische Synthese 

Für ein Projekt wurde der neben dem im vergangenen Jahr implementierten AMR-NB (Adaptive Multi 

Rate Narrowband)-Dekoder der AMR-WB (Wideband) für die akustische Synthese angepasst. Mit 

dem entsprechenden AMR-WB-Kodierer wurden die Inventare erzeugt. 

Der AMR-WB-Koder ist, wie der AMR-NB-Koder, ein CELP (Code Excited Linear Prediction) -basierter 

Algorithmus. Er arbeitet, im Gegensatz zum AMR-NB intern bei einer Abtastrate von 12.8 kHz. Nach 

der Synthese des Sprachsignals durch Filterung des Residualsignals mit den LPC-Koeffizienten findet 

ein Hochsamplen auf 16 Khz Abtastrate und eine Anreicherung mit höheren Frequenzen, welche aus 

dem unteren Frequenzbändern geschätzt werden. 

Zum Dekoder übertragen werden die aus den LPC (linear predictive coding) -Koeffizienten ermittelten 

LSP (line spectral frequencies) -Koeffizienten und Periodenmarkeninformationen sowie die Kodebuchindizees 

für die Rekonstruktion des Anregungs- bzw. Residualsignals. 

Die akustische Synthese greift vor der Filterung ein, indem die Periode des Anregungssignal durch 

ein zeitbasiertes Verfahren manipuliert wird, um die von der Vorverarbeitung generierten Grundfrequenzkontur 

aufzuprägen. Die Phonemdauern werden durch Einfügen bzw. Auslassen von Anregungssignalperioden 

und Filterkoeffizienten gesteuert. 

44

Inventargenerierung und Inventargrößen 

Forschung 

Ähnlich der Vorgehensweise beim AMR-NB wurden die AMR-WB-Inventare durch bausteinweises 

Kodieren erzeugt. Entsprechen den neun Skalierungsstufen des Koders entstanden neun Inventare 

pro Inventarstimme. Beispielgrößen eines deutschen Inventars (weibliche Sprecherin) sind in folgender 

Tabelle zusammengestellt: 

kBit/s: 23,85 23,05 19,85 18,25 15,85 14,25 12,65 8,85 6,6 original 

Inventargröße/ 

Byte: 

84858 

4 

82224 

8 

71728 

8 

66480 

8 

58618 

4 

53370 

4 

48122 

4 

35677 

6 

28269 

8 

659696 

8 

Alle Inventare des Projektes wurden als ROM-Image generiert, d. h., während der Synthese können 

keine Änderungen am Inventar vorgenommen werden. Außerdem wurden auf Platformunahbängigkeit 

geachtet, wie z. B. Ausrichten (Alignment) der Datentypen an Zeigeradressen. Die entsprechenden 

Änderungen am Programmkode der Synthese wurden vorgenommen, sowie die vollständige Umstellung 

auf Festkommaarithmetik. 

e) Sprechendes Wörterbuch 

Wie aus dem Jahresbericht 2003 bekannt ist, entwickelt das Institut für Sprechwissenschaft und Phonetik 

der Martin-Luther-Universität Halle-Wittenberg ein neues Wörterbuch der deutschen Aussprache, 

das mit der Möglichkeit versehen werden soll, die Normaussprache gewünschter Wörter mit Hilfe 

von Sprachsynthese anhören zu können. Die dafür erforderliche Synthesekomponente wird von unserer 

Arbeitsgruppe als Ableitversion von DRESS unter der bezeichnung lexDRESS entwickelt. 

Wesentlicher Bestandteil des Projektes ist die Entwicklung einer Diphon-Datenbasis unter Einbeziehung 

sprechwissenschaftlicher Expertise. Die Definition einer solchen Datenbasis erfolgte 2003. Im 

Berichtsjahr wurden die Trägerwörter von einer geschulten Sprecherin gesprochen, und die Diphone 

wurden extrahiert. 

Als experimentelle Basis wurde von Herrn Sobe eine Oberfläche entwickelt, unter der eine erste Version 

von lexDRESS einfach benutzbar ist, indem man die zu sprechenden Wörter in Rechtschrift, der 

IPA-Transkription und der Transkription mit extended SAMPA darstellen und editieren kann. 

Da das Projekt ausschließlich durch Haushaltmittel finanziert wird, gelang im Berichtsjahr lediglich die 

Erstellung und Evaluierung von Synthese-Beispielen unter Benutzung der Rohschnitt-Diphone (siehe 

den Bericht zum Projektstand auf der Konferenz ESSV 2004). Damit liegen alle Voraussetzungen für 

eine Systemoptimierung im kommenden Jahr vor. 

3.2.4 Entwicklung einer Text-To-Speech-Applikation und dynamischer 

Bewertungsverfahren 

Dieses Projekt ist seit Mai 2004 unser Anteil an einem AiF-geförderten Vorhaben mit dem Thema 

„Entwicklung eines Selbstlernsystems mit Mehrkanal-Rückkopplung für das Training der deutschen 

Aussprache“ (kurz AZAR = Apparat zur Akzentreduzierung), an dem insgesamt die Partner Gesellschaft 

für Wissens- und Technologietransfer der TUD, voiceINTERconnect GmbH Dresden und REZO 

Computerservice GmbH & Co. KG Dresden beteiligt sind. Ziel des Projektes ist die Entwicklung eines 

multimedialen Sprachtrainers zum Erlernen der deutschen Aussprache. Für die Entwicklung komplexer 

Feedback-Funktionen werden Verfahren der Spracherkennung und der Sprachsynthese eingesetzt, 

die das dynamische Detektieren akzentbedingter Abweichungen von der Standardlautung ermöglichen. 

Zusätzlich zur akustischen Ein- und Ausgabe sind visuelle Feedbackfunktionen (graphische 

Ausgabe akustischer Parameter, Darstellung der artikulatorischen Abläufe in sagittaler Projektion 

durch Animationssequenzen, Darstellung der Lippenartikulation) vorgesehen. Die Komplexität der 

Aufgabenstellung resultiert aus der Zusammenführung von Verfahren der akustischen Sprachsignalanalyse 

und der Modellierung artikulatorischer Abläufe in einem interaktiven System. Im Rahmen des 

Projektes wird der Versuch unternommen, das artikulatorische Modell aus einem Code zu generieren, 

der sich direkt auf das akustische Sprachsignal bezieht. 

Entsprechend der in den Arbeitspaketen festgelegten Aufgabenverteilung wurden im angegebenen 

Zeitraum die wesentlichen Arbeiten zur Gewinnung und Aufbereitung der Datenbasis abgeschlossen 

sowie linguistische Untersuchungen der gewonnenen Daten durchgeführt. Zunächst wurden phonetisch 

ausgewogene Textkorpora zur Erhebung der Leseaussprache (Testsätze, Wortformen, Wortgruppen, 

Lesetexte) sowie Aufgaben (Sprechimpulse) für die Erhebung spontansprachlicher Fertigkei- 

45

Forschung 

ten erstellt. Die Textkorpora wurden phonemisch in SAMPA transkribiert. Nach Probeaufnahmen mit 

zwei Probanden im Mai 2004 erfolgte die Optimierung der Textbasis. Durch individuelles Coaching 

wurden 10 erwachsene Lerner unterschiedlicher Niveaustufen (Migranten aus dem ostslawischen 

Raum) auf die Tests vorbereitet. Für die Erhebung der muttersprachlichen Referenzdaten, die für die 

Entwicklung von Spracherkennungssoftware unerlässlich sind, wurde eine phonetisch ausgewogene 

Textbasis in russischer Sprache erstellt. Im Juli wurden Audioaufnahmen durchgeführt, die als Ausgangsbasis 

für das Annotieren der Sprachdaten dienten. Die manuell segmentierten und kanonisch 

gelabelten Sprachdaten werden linguistisch analysiert und statistisch ausgewertet. Im Ergebnis der 

statistischen Auswertung werden die Schwellwerte akustischer Parameter für die Unterscheidung der 

Akzentaussprache von akzentfreien Realisationen bestimmt. 

Im Oktober 2004 wurden mit 8 Lernenden aus Osteuropa und 10 muttersprachlichen deutschen Sprechern 

die Korpusdaten in vollem Umfang aufgezeichnet. Die akustischen Aufzeichnungen wurden 

dabei mit Videoaufnahmen der Lippenartikulation synchronisiert. Im Ergebnis der linguistischvergleichenden 

Untersuchung der gewonnenen Sprachdaten ist eine maschinenlesbare Notation für 

die akzentbedingten Abweichungen entstanden. Es handelt sich hierbei um eine Hybrid-Notation aus 

den SAMPA-Zeichensätzen für Standarddeutsch und die russische Literatursprache. Damit wurde 

eine wesentliche Voraussetzung für die Entwicklung akustischer Feedback-Funktionen geschaffen. 

Die gegenwärtig laufenden phonetischen Analysen verfolgen das Ziel, akzentrelevante realisationsphonetische 

Merkmale zu ermitteln, die im Selbstlernsystem automatisch extrahiert werden sollen. 

3.2.5 Sprachsteuerung eines Computerspiels 

Die Spracherkennung und Sprachsynthese haben trotz langjähriger intensiver Forschung vergleichsweise 

wenig praktischen Einsatz erfahren. Die Gründe dafür sind an unterschiedlichen Stellen zu suchen. 

Einerseits sind Akzeptanzprobleme zu nennen, da die synthetische Sprache je nach Ressourceneinsatz 

deutlich schlechter als die natürliche Sprache ist und die Spracherkennung mit einer gewissen 

Fehlerrate verbunden ist. Des Weiteren setzt sich die Sprachtechnologie gegenüber etablierten 

Methoden des Dialoges nicht durch, wenn die Vorteile der neuen Dialogführung nicht überwiegen. 

Zu guter Letzt muss diese Problematik auch aus der Position der Anwendung betrachtet werden, da 

sich nicht automatisch jedes Medium zur Dialogführung eignet. In einer Diplomarbeit wurde anhand 

eines Computerspiels der Einsatz von Sprachtechnologie untersucht und anhand von Nutzerbefragungen 

evaluiert. Dabei wurden besonders ergonomische Kriterien beachtet. Die Ergebnisse dieser 

Arbeit lassen sich wie folgt zusammenfassen: 

1. Die Spracheingabe erfordert, ebenso wie die Mausbedienung, eine Lernphase. Dabei ist in beiden 

Fällen eine Adaption des Menschen auf das jeweilige System zu beobachten. 

2. Die Verwendung von Spracheingabe vereinfacht durch ihre Vielseitigkeit das Dialogmodell der 

Anwendung. 

3. Sprachbedienung ist grundsätzlich langsamer als die Bedienung mit der Maus. Damit die Sprachbedienung 

der Mausbedienung vorgezogen wird, muss dieser Nachteil durch andere Vorzüge 

ausgeglichen werden. 

4. Die Sprachsynthese ist nicht auf einem Stand, wo sie mit natürlicher Sprache vergleichbar ist. Die 

Anwendung als Zusatz zur Textausgabe auf dem Bildschirm wird jedoch akzeptiert. 

5. Konfidenzmaße bei der Spracherkennung ermöglichen eine Bewertung der Qualität der Erkennung. 

Sie müssen jedoch bei jedem Einsatzfall auf ihre Eignung überprüft werden. 

6. Die Eignung einer Anwendung für die Bedienung mit natürlicher Sprache ist nicht automatisch 

gegeben, sondern muss untersucht werden. Die Sprache ist u. U. nicht oder nur in Verbindung mit 

anderen Eingabeformen (z. B. Haptik) einsetzbar. 

7. Die Bewertung der Ergonomie ist abhängig von den Anforderungen an den Benutzer, das System 

und die Anwendung. Generelle Aussagen über die ergonomischen Eigenschaften sind deshalb 

nur sehr allgemein möglich, die Untersuchung muss vielmehr für jeden Anwendungsfall gesondert 

durchgeführt werden. 

Literatur: D. Sobe, M. Eichner, “Sprachsteuerung eines Computerspiels- Untersuchungen zur Leistungsfähigkeit 

und Ergonomie”,15. Konferenz ESSV = Studientexte zur Sprachkommunikation Bd. 30, 

S. 292-299. 

46

Forschung 

3.2.6 Historische phonetische Geräte 

Wie in früheren Jahresberichten bereits angekündigt wurde, besteht das Ziel, die Dresdener Sammlung 

historischer phonetischer Geräte durch eine ausführliche Web-Präsentation zu erschließen. Im 

Berichtsjahr wurde durch die Herren Prof. Mehnert und Dr. Dietzel daran zielstrebig weitergearbeitet. 

Es liegen jetzt digitalisierte Bilder vollzählig vor, die Schritt für Schritt durch kurze Beschreibungen der 

Exponate ergänzt werden. 

Auch bei der Instandsetzung und Präsentation der Geräte konnten Fortschritte erzielt werden. Abbildung 

29 zeigt ein Beispiel. Durch die Präsentation der Ergebnisse auf geeigneten Veranstaltungen 

konnten Kontakte geknüpft werden, die zeigen, dass ein deutliches Interesse an der Aufarbeitung und 

Sicherung der Zeugnisse der Vergangenheit unseres Fachgebietes besteht. Zu erwähnen wäre dabei 

besonders der Budapester Workshop zum 200. Todestag von Wolfgang von Kempelen. 

Abbildung 29: Restaurierung eines Kymographen mit Ausrüstung für die Grundfrequenzmessung. 

Links: Vorbild für die Rekonstruktion (Panconcelli-Calzia: Das Hamburger experimentalphonetische 

Praktikum, I. Teil, 1922). Rechts: Die rekonstruierte Anordnung aus Universal-Kymograph, Kehltonschreiber, 

Chronograph und Universalstativ. Foto: R. Dietzel. 

47

Drittmittelprojekte und haushaltfinanzierte Forschung 

4 Drittmittelprojekte und haushaltfinanzierte Forschung 

4.1 Drittmittelprojekte 

Verbrennungslärm: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern 

2002 – 2005 

DFG-Forschergruppe „Verbrennungslärm“, Teilprojekt 4 (KO1242/10-1, /10-2) 

Projektleiter: Prof. Dr. P. Költzsch, Prof. Dr. M. Ochmann 

Bearbeiter: Dipl.-Ing. H. Brick, Dr. R. Piscoya 

Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen und 

Oberflächendruckfelder 

2001-2004 

DFG-Projekt (KO 1242/6-3, /6-4) 

DFG/BMBF-Verbundprojekt: 4 Universitäten, DLR Braunschweig 

Projektleiter: Prof. Dr. P. Költzsch 

Bearbeiter: Dipl.-Ing. M. Bauer, Dipl.-Ing. A. Zeibig, Dr. A. Borisyuk, Dipl.-Ing. D. Richter 

Experimentelle Untersuchungen zur Validierung von aeroakustischen Quellgrößen und CAA- 

Rechnungen 

2001-2004 

Auftraggeber: DLR, Deutsches Zentrum für Luft- und Raumfahrt, Institut für Aerodynamik und Strömungstechnik, 

Braunschweig 


Bearbeiter: Dipl.-Ing. A. Zeibig 

Akustische Simulationsverfahren: Vorausberechnung von Strömungs- und Körperschall bei 

typischen Fahrzeugstrukturen mit dem Ziel der Lärmminderungsprognose 

Forschungsverbund „Leiser Verkehr“ (DLR, EADS München, TU Dresden) 

2001-2004 

Koordinator und Teilprojektleiter Strömungsschall: Prof. Dr. P. Költzsch 

Teilprojektleiter Körperschall: Dr. E. Sarradj 

Bearbeiter: Dr. E. Sarradj, Dipl.-Ing. B. Knöfel, Dr. A. Borisyuk, FhI IS Dresden, 

AFD Dresden 

Entwicklung und Testung neuer lärmabsorbierender Werkstoffe auf der Basis metallischer 

Hohlkugelstrukturen 

2002-2004 

Auftraggeber: Fraunhofer-Gesellschaft, Institut für Angewandte Materialforschung (IFAM) 


Bearbeiter: Dipl.-Ing. J. Hübelt, Dr. E. Sarradj 

Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur lärmoptimalen 

Gestaltung der Bauteile von Verkehrsmitteln 

2004 

Projektförderung durch die Friedrich-und-Elisabeth-BOYSEN-Stiftung 


Bearbeiter: Dipl.-Ing. A. Witing, Dr. V. Bormann, Student M. W. Kettlitz, Dipl.-Ing. A. Zeibig, Dipl.-Ing. 

M. Bauer 

DFG-Sonderforschungsbereich 639 „Textilverstärkte Verbundkomponenten für funktionsintegrierende 

Mischbauweisen bei komplexen Leichtbauanwendungen“ 

Teilprojekt D3: Integrierte Sensornetzwerke 

2004-2007 

Projektlieter des IAS: Prof. Dr. G. Pfeifer 

Bearbeiter: Dipl.-Ing. S. Folprecht, Dipl.-Ing. E. Starke, 

Dipl.-Ing. J. Landgraf 

48


Ultraschallwandler für gerichtete Audioabstrahlung 

1999 - 2004 

Auftraggeber: Sennheiser electronic GmbH 

Bearbeiter: Prof. Dr. G. Pfeifer 

Mikrofon mit weitgehend frequenzunabhängiger Richtcharakteristik 

Auftraggeber: Microtech Gefell 

2003-2004 

Bearbeiter: Dipl.-Ing. D. Richter 

Bestimmung von Kenngrößen eines Telefonhörers 

Auftraggeber: Kommunikationstechnik PRAGMA Zittau 

2004 

Bearbeiter: Dr. G. Fuder 

Integration von Spracherkennung und –synthese unter Verwendung gemeinsamer Datenbasen 

2001 – 2005 

DFG-Projekt HO 1674/7 

Projektleiter: Prof. Dr. R. Hoffmann 

Bearbeiter: Dipl.-Ing. M. Cuevas, T. Oba, M.A. 

Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer Prozesse basierend 

auf spektralen Repräsentationen akustischer Vorgänge 

2004 – 2005 

DFG-Projekt HO 1674/8-1 

Gemeinschaftsprojekt mit Fraunhofer Institut für zerstörungsfreie Prüfverfahren, Außenstelle Dresden 

Projektleiter IZFP: Dr.-Ing. D. Hentschel 

Projektleiter TUD: Prof. Dr. R. Hoffmann 

Bearbeiter: Dipl.-Inf. C. Tschöpe, Dipl.-Ing. S. Werner 

Nichtinvasive Blutdruckmessung am aktiven Menschen 

2004 – 2005 

Gesundheitstechnik Stier, Neuruppin 


Bearbeiter: Dr. U. Kordon, Dipl.-Ing. H. Hussein 

Industrielle Anwendungen der technischen Sprachkommunikation 

2004 

Gesellschaft für Wissens- und Technologietransfer der TU Dresden mbH, 

Servicebereich „Signalverarbeitung und Mustererkennung“ 

Hauptanwender im Berichtsjahr: Siemens AG 

Projektleiter: Prof. Dr. R. Hoffmann, Dr. U. Kordon, Dipl.-Ing. O. Jokisch 

Erstellung einer Sprachdatenbank für Sprachsynthese und Sprachkonversion 

2004 - 2005 

Siemens CT München, Unterauftrag im EU-Projekt TC-STAR 


Entwicklung einer Text-to-Speech-Applikation und dynamischer Bewertungsverfahren 

für ein Selbstlernsystem für die deutsche Aussprache (AZAR) 

2004 – 2006 

Zuwendung des BMBF im Rahmen des Programmes PRO INNO an die 

Gesellschaft für Wissens- und Technologietransfer der TU Dresden mbH 

Bearbeiter: Dipl.-Slaw. R. Jäckel, Dipl.-Ing. M. Lachmann 

Projektpartner: voiceINTERconnect GmbH Dresden, REZO Computer-Service Dresden 

Zweisprachiges Sprachsynthesesystem deutsch-tschechisch 

2004 – 2007 

DAAD-Programm Ostpartnerschaften 

Kooperation mit Karls-Universität Prag und TU Prag 

Bearbeiter TUD: Dr. U. Kordon 

49


4.2 Haushaltfinanzierte Forschungsaufgaben 

Ultraschallsicherheit diagnostischer Geräte 

Schallfeldmodellierungen – Suche nach „hot spots“, Schallabsorption und –streuung, Wärmeleitung in 

festen und fluiden Medien 

2001 – 2004 

Doz. Dr. E. Kühnicke 

Ultraschallbildgewinnung 

Einsatz und Bildverarbeitung für 3D-US-Daten, Modellierung des US-Aufnahmeprozesses 

2002-2004 


Dresdner Sprachsynthesesystem DRESS / microDRESS 

2004 

Prof. Dr. R. Hoffmann, Dr. H. Ding, Dipl.-Ing. O. Jokisch, 

Dr. U. Kordon, Dipl.-Ing. H. Kruschke, Dipl.-Ing. G. Strecha u. a. 

Hochwertiges Diphoninventar für die deutsche Sprachsynthese 

2002 – 2005 

Kooperation mit Prof. Dr. U. Hirschfeld, MLU Halle/Saale 

Prof. Dr. R. Hoffmann, Dipl.-Ing. O. Jokisch, Dr. H. Ding, 

Dipl.-Ing. M. Lachmann, Dipl.-Ing. D. Sobe 

Web-basierter Sprachserver 

2004 

Nachfolgearbeiten zum BMBF-Verbundprojekt eL-IT (2001 – 2003) 

Dipl.-Ing. M. Eichner, Dipl.-Ing. D. Sobe, Dr.-Ing. M. Wolff 

Stimmaktivierung unter Nutzung prosodischer Merkmale 

2004 

Dipl.-Ing. M. Eichner, Dipl.-Wi.-Ing. M. Kühne, Dr.-Ing. M. Wolff 

Historische phonetische Geräte 

ab 2002 

Prof. Dr. D. Mehnert, Dr. R. Dietzel 

50

5 Veröffentlichungen 

Veröffentlichungen 

5.1 Bücher, Buchbeiträge 

[1] DELFS, J. und KÖLTZSCH, P. (Herausgeber): Vortragsband (CD/Webseite des DLR) zur 

Sitzung des DGLR-Fachausschusses T 2.3 „Strömungsakustik/Fluglärm“, 30.01.2004, DLR 

Braunschweig/TU Dresden. 

[2] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Sprachtechnologien in eL-IT: Einsatzszenarien 

und Umsetzung. In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen: 

Skaker Verlag 2004, ISBN 3-8322-2531-5, 111 – 120. 

[3] HOFFMANN, R.; KORDON, U.; KÜRBIS, S.; LACHMANN, M.: Signalverarbeitung und ihre 

Anwendung in der Akustik: Die Module „Signalverarbeitung“ und „Elektro- und Psychoakustik“. 

In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen: Shaker Verlag 

2004, ISBN 3-8322-2531-5, 69 – 78. 

[4] LESCHKA, S.; PFEIFER, G.: Ultraschallwandler mit PVDF-Folien - ein Berechnungsansatz 

mit Netzwerkmethoden. In: Schriftenreihe AHMT, XVII. Messtechnisches Symposium Freiburg 

2004. Shaker Verlag, Aachen 2004 ISBN: 3-8322-3190-0. 

[5] PETRICK, R.; HIRSCHFELD, D.; RICHTER, T. (VIC Dresden); HOFFMANN, R.: Verbkey – A 

single-chip speech control for the automobile environment. In: ABUT, H.; HANSEN, J. H. L.; 

TELEDA, K (Eds.), DSP for In-Vehicle and Mobile Systems. Springer eBook available at 

Kluwer Online, ISBN 0-387-22979-5. 

[6] SCHRÖDER, W. (Herausgeber): Fourth Aeroacoustics Workshop SWING (Simulation of wingflow 

noise generation). Co-organized by: RWTH Aachen – Aerodynamisches Institut / TU 

Dresden – Institut für Akustik und Sprachkommunikation (P. Költzsch, A. Zeibig). 26. – 27. 

Februar 2004, Aachen. Vortragsband Aachen/Dresden 2004, 154 Seiten. 

[7] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. Dresden: w.e.b. Universitätsverlag 

2004 = Studientexte zur Sprachkommunikation; 32. ISBN 3-937672-71-0. 

5.2 Veröffentlichungen in Zeitschriften 

[8] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; KÜHNE, M.; WOLFF, M.: 

Speech-enabled services in a web-based e-learning environment. Advanced Technology for 

Learning 1 (2004) 2, 91 – 98. 

[9] FELDMANN, U.; BHATTACHARYA, J. (ÖAW Wien): Predictability improvement as an 

asymmetrical measure of interdependence in bivariate time series. International Journal of 

Bifurcation and Chaos 14 (2004) 2, 505 – 514. 

[10] HUEBELT, J.; KOSTMANN, C.; KOELTZSCH, P., STEPHANI, G.: Schallabsorber aus metallischen 

Hohlkugelstrukturen. In: Internationale Messe für Fertigungstechnik und Automatisierung, 

METAV München, 27.04. - 30.04.2004. 

[11] WERNER, S.; EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Towards spontaneous speech 

synthesis – Utilizing language model information in TTS. IEEE Trans. on Speech and Audio 

Processing 12 (2004) 4, 436 – 445. 

[12] ZEIBIG, A., BAUER, M.: Aerodynamische und aeroakustische Messungen am Windkanal zur 

Validierung numerischer Simulationen. Vortrag DGLR Fachausschusssitzung Strömungsakustik/Fluglärm, 

30.01.2004, DLR Braunschweig, Vortragsband, CD. 

5.3 TU-Informationen und Lehrmaterial 

[13] KORDON, U.: Technische Sprachkommunikation. Folienskript zur Vorlesung, TU Dresden, 

April 2004, 66 Seiten. 

[14] KORDON, U.: Sprachsynthese. Folienskript zur Vorlesung, TU Dresden, Oktober 2004, 50 

Seiten. 

[15] HOFFMANN, R.: Speech, Text, and Braille Conversion Technology. Preprint, TU Dresden, 

August 2004, 71 S. 

51


5.4 Vortragsveröffentlichungen 

[16] BAUER, M.: Applicability of the SNGR model to compute Trailing Edge Noise. Proceedings of 

the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France, pp. 129 – 130. 

[17] BAUER, M.; ZEIBIG, A.: Applicability of the Modified von Kármán Spectrum to Predict 

Broadband Trailing Edge Noise. Tagungsband 14. DGLR/STAB Symposium, November 2004 

(Veröffentlichung durch den Springer Verlag im Jahr 2005 vorgesehen). 

[18] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P.: Modelling of combustion noise 

with the Boundary Element Method and Equivalent Source Method. Proceedings of Internoise 

2004, August 22– 25, Prague, Czech Republic 2004. 

[19] DING, H.; JOKISCH, O.: Grapheme-to-phoneme conversion in Mandarin Chinese text-tospeech. 

Proceedings of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg, 

France, 1151 – 1152. 

[20] DING, H.; JOKISCH, O.; HOFFMANN, R.: Glottalization in inventory construction: A crosslanguage 

study. Proc. Intern. Symposium on Chinese Spoken Language Processing 

(ISCSLP), December 15 – 18, Hong Kong, 37 – 40. 

[21] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; WOLFF, M.: Speech enabled 

services in a web-based e-learning environment. Proc. of the IASTED International 

Conference on Web-Based Education, February 16 – 18, 2004, Innsbruck, Austria, 157 – 162. 

[22] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Voice characteristics conversion for TTS using 

reverse VTLN. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), 

May 17 – 21, Montreal, Canada, I-17 – I-20. 

[23] EWERT, R.; BAUER, M.: Towards the Prediction of Trailing Edge Noise via Stochastic 

Surface Sources. AIAA-Paper 2004-2861, American Institute for Aeronautics and 

Astronautics, 2004. 

[24] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; HIRSCHFELD, D. (VIC Dresden): Advances 

in speech technology for embedded systems. Conference and Workshop on Assistive 

Technologies for Vision and Hearing Impairment (CVHI), June 29 – July 2, 2004, Granada, 

Spain, Abstracts p. 30 / Proceedings (CD-ROM). 

[25] HOFFMANN, R.; JOKISCH, O.; KORDON, U.; STRECHA, G.: Progress in scalable speech 

synthesis. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15, 

2004, Prague, 9 – 10. 

[26] HOFFMANN, R.; JOKISCH, O.; HIRSCHFELD, U. (MLU Halle); Anders, L. C. (MLU Halle): 

LexDRESS – Speech synthesis for a speaking pronunciation dictionary – First results. In: 

FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz, 

20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30, 

183 – 190. 

[27] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; VOLK, T.; HAIN, H.-U. (Siemens CT); 

FINGSCHEIDT, T.; AALBURG, S.; STAN, S. (Siemens ICM): Sprachsynthese mit minimiertem 

Footprint für Embedded-Anwendungen. VDE-Kongress „Innovationen für Menschen“, 18. 

– 20. Oktober 2004, Berlin, Band 1: Fachtagungsberichte der ITG / ETG. Berlin / Offenbach: 

VDE Verlag 2004, 187 – 192. 

[28] HOFFMANN, R.; MEHNERT, D.: Measuring pitch with historic phonetic devices. Proceedings 

of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg, France, 1147 – 1148. 

[29] HOFFMANN, R.; SHPILEWSKY, E. (Univ. Bialystok); LOBANOV, B. (Academy of Sciences 

Minsk); RONZHIN, A. (Inst. f. Informatics and Automation, St. Petersburg): Development of 

multi-voice and multi-language Text-to-Speech and Speech-to-Text conversion system 

(languages: Belorussian, Polish, Russian). Proc. of the 9 th Intern. Conf. “Speech and 

Computer” (SPECOM), Sep. 20 – 22, 2004, St. Petersburg, 657 – 661. 

[30] HOLSTEIN, P.; KOCH, M. (SINUS Messtechnik); HIRSCHFELD, D. (VIC Dresden); 

HOFFMANN, R.; BADER, D.; AUGSBURG, K. (TU Ilmenau): A strategy for signal recognition 

under adverse conditions. Proc. Internoise, August 25 – 28, 2003, Jeju, Korea, N-111 [Nachtrag 

zu Jahresbericht 2003]. 

52


[31] HUEBELT, J.; ZEIBIG, A.; KOSTMANN, C.; STEPHANI, G.: Parameter of metallic hollow 

spheres - a porous sound absorbing material. Proceedings of 18 th International Congress on 

Acoustics, Japan, April 4 until 9 2004, Kyoto. 

[32] JOKISCH, O.; HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung für 

Sprachsynthese. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband 

der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation 

Bd. 30, 175 – 182. 

[33] JOKISCH, O.; HOFMANN, M.: Evolutionary optimization of an adaptive prosody model. Proc. 

8 th International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004), 

October 4 – 8, 2004, Jeju Island, Korea, TuC201p.18. 

[34] KNÖFEL, B. und SARRADJ, E.: Structure-borne Sound in Automotive Structures: High 

Frequency Boundary Element Method (HFBEM) vs. Statistical Energy Analysis (SEA). 

Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, 

France“, Vortragsband, CD, S.13-14. 

[35] KNÖFEL, B. und SARRADJ, E.: An Alternative Method To Compute High Frequency Structure 

Borne Sound In Automotive Structures. Proceedings of the 11 th International Congress on 

Sound and Vibration, July 05 - 08 2004, St. Petersburg, Russia, S. 3257-3264. 

[36] KÖLTZSCH, P. und V. BORMANN: Überlegungen zur Optimierung mit subjektiven Zielfunktionen 

(mit Beispielen aus der Akustik). Proceedings of the Joint Congress CFA/DAGA 2004, 

22. – 25. März 2004, Strasbourg, France. 

[37] KÖLTZSCH, P.; BAUER, M.; WITING, A.; ZEIBIG, A.; KETTLITZ, M. W.: Beitrag zur Modellierung 

von Strömungsschallquellen mit akustischen Elementarstrahlern. Vortrag, Deutscher 

Luft- und Raumfahrtkongress, Dresden, 2004, Kongressband + CD. 

[38] KÖLTZSCH, P.: Werner Albring und die Ähnlichkeitsmechanik. Vortrag zum Ehrenkolloquium 

anlässlich des 90. Geburtstages von Prof. em. Dr.-Ing. h.c. mult. Werner Albring, Berlin- 

Brandenburgische Akademie der Wissenschaften, 28. September 2004, Kolloquiumsband. 

[39] KÖLTZSCH, P.: Einführung in die Strömungsakustik. Vortrag zum Lehrgang „Strömungsinduzierter 

Lärm“, 12. - 14. Oktober 2004, Universität Erlangen-Nürnberg. Vortragsband S. 1 -19. 

[40] KÖLTZSCH, P.: Technische Akustik/Strömungsakustik – ausgewählte Grundlagen. Vortrag 

zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen, 

23. – 24. November 2004, Vortragsmappe S. 1 – 18. 

[41] KÖLTZSCH, P.: Geräuscherzeugung durch Strömungen – Grundlagen und Überblick. Vortrag 

zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen, 

23. – 24. November 2004, Vortragsmappe, S. 1 – 41. 

[42] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic 

features. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15, 2004, 

Prague, p. 11. 

[43] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic 

features. Proc. 8 th International Conference on Spoken Language Processing (ICSLP, 

INTERSPEECH 2004), October 4 – 8, 2004, Jeju Island, Korea, FrB202p.9. 

[44] KÜHNICKE, E.: GREEN’S functions for complex boundary conditons. Proc. of the 18th International 

Congress on Acoustics, April 4 – 9, Kyoto, Japan, pp. II-997 - II-982. 

[45] Putz, A.; Kühnicke, E.: Simulationsbasierte Optimierung eines Ultraschallmessverfahrens zur 

Bewertung der Montagequalität armierter Werkzeuge für die Kaltmassivumformung, DACH- 

Jahrestagung der DGZfP, Berichtsband 89-CD, Salzburg 17.-19. Mai 2004. 

[46] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop 

Speech Processing, September 13 – 15, 2004, Prague, p2 – 15. 

[47] PISCOYA, R., OCHMANN, M., BRICK, H., KÖLTZSCH, P.: Modelling of the combustion noise 

by means of the equivalent source method (ESM). Proceedings of the Joint Congress 

CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France. 

53


[48] SARRADJ, E.; SCHULZE, C.; ZEIBIG, A.: Mikrofonarray mit Nahfeld-Beamforming. 6. Internationale 

Wissenschaftliche Konferenz „Saterra“, Tagungsband, 12. November 2004, HTW Mittweida. 

[49] SCHULZE, C.; ZEIBIG, A.; RICHTER, D.: Basic Investigations of Microphone Arrays. 

Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, 

France. 

[50] SCHULZE, C.; SARRADJ, E.; ZEIBIG, A.: Characteristics of microphone arrays. Proceedings 

of Internoise 2004, August 22 – 25, Prague, Czech Republic. 

[51] SCHNELL, M.: Verstärkungslernen zur Prosodievorhersage in einem Sprachproduktionssystem. 

In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 

15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation 

Bd. 30, 140 – 147. 

[52] SCHNELL, M.; HOFFMANN, R.: What concept-to-speech can gain for prosody. Proc. 8 th 

International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004), 

October 4 – 8, 2004, Jeju Island, Korea, FrA1402o.6. 

[53] SOBE, D.: Investigating capabilities and ergonomic properties of a speech controlled 

computer game. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 

15, 2004, Prague, p. 16. 

[54] SOBE, D.; EICHNER, M.: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit 

und Ergonomie. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. 

Tagungsband der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte 

zur Sprachkommunikation Bd. 30, 292 – 299. 

[55] STRECHA, G.; JOKISCH, O.; HOFFMANN, R.: A resource-saving modification of TD-PSOLA. 

Advances in Speech Technology. International Workshop, July 3 – 4, 2003, Maribor, 151 – 

155 [erschienen 2004]. 

[56] STRECHA, G.: Neue Ansätze zur Sprachsynthese mit kodierten Sprachsegmenten. In: 

FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz, 

20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30, 

156 – 162. 

[57] TSCHÖPE, C.; HENTSCHEL, D. (FhG Dresden); WOLFF, M.; EICHNER, M.; HOFFMANN, 

R.: Classification of non-speech acoustic signals using structure models. Proc. IEEE Int. Conf. 

on Acoustics, Speech, and Signal Processing (ICASSP), May 17 – 21, Montreal, Canada, V- 

653 – V-656. 

[58] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Integrating speech enabled 

services in a web-based e-learning environment. Int. Conf. on Information Technology (ITCC), 

April 5 – 7, 2004, Las Vegas, USA, vol. 2, 303 – 307. 

[59] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Modeling pronunciation variation 

for spontaneous speech synthesis. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal 

Processing (ICASSP), May 17 – 21, Montreal, Canada, I-673 – I-676. 

[60] WOLFF, M.; KÜHNE, M.: Stimmaktivierung eines Spracherkenners. In: FELLBAUM, K. 

(Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz, 20. – 22. 

September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30, 69 – 78. 

[61] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Aeroacoustic 

Measurements and Validation Regarding Trailing Edge Noise. Proceedings of the 4 th 

Aeroacoustic Workshop in connection with the project SWING, February 26 – 27 2004, 

Aachen. 

[62] ZEIBIG, A.; SCHULZE, C.; HÜBELT, J.: Microphone array measurements for aeroacoustic 

investigations using a frequency band filtering method. Proceedings of the Joint Congress 

CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France. 

[63] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: 

Aeroacoustic measurements for the validation of numerical simulations. Proceedings of the 

11 th International Congress on Sound and Vibration, July 05 - 08 2004, St. Petersburg, 

Russia. 

54


[64] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; HÜBELT, J.: Microphone array measurements for 

aeroacoustic source analysis. Proceedings of the 11 th International Congress on Sound and 

Vibration, July 05 - 08 2004, St. Petersburg, Russia. 

[65] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; BAUER, M.: Validation of aeroacoustic numerical 

simulations with wind tunnel measurements. Proceedings of Internoise 2004, August 22 – 25, 

Prague, Czech Republic. 

[66] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ: Aeroakustische 

Messungen am Windkanal zur Validierung numerischer Simulationen. Vortrag, 6. Internationale 

Wissenschaftliche Konferenz SATERRA, 11.-16. November 2004 HTW Mittweida, 

Tagungsband. 

5.5 Vorträge (ungedruckt) 

[67] BAUER, M.: Überblick über Arbeiten mit dem SNGR-Modell (IAS & DLR). Vortrag bei Robert 

Bosch GmbH, 15.10.04, Stuttgart. 

[68] BAUER, M.: Berechnung von Umströmungsgeräuschen mit Hilfe eines synthetischen turbulenten 

Geschwindigkeitsfeldes, Vortrag beim Kolloquium der Akustiker des DLR, 22.10.04, TU 

Berlin. 

[69] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P: Berechnung von Verbrennungslärm 

mit der Boundary-Elemente- und der Ersatzstrahlermethode. 11. Workshop Physikalische 

Akustik, Bad Honnef, 17. September 2004 (erscheint demnächst in Acustica/Acta acustica). 

[70] DING. H.; JOKISCH, H.: An advanced American diphone inventory from the phonetic-acoustic 

viewpoint. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004, Maribor, 

Slovenia, Abstracts p. 25 – 26. 

[71] FELDMANN, U.: Design and synchronization of inverse systems. COST-277 Non-linear 

speech processing – MC meeting & seminar, April 15 – 16, 2004, Limerick, Ireland. 

[72] HOFFMANN, R.: Der Weg zur eingebetteten Sprachsynthese. Universität Trier, Phonetik- 

Workshop, 4. Juni 2004. 

[73] HOFFMANN, R.: Kommunikationsakustik. Vortrag im Rat der Fakultät Elektrotechnik und Informationstechnik, 

21. Juli 2004. 

[74] HOFFMANN, R.: Technologische Fortschritte in der Spracherkennung und -synthese. T- 

Systems, Customer Care Center Circle für Versicherungen, 11. Oktober 2004, Leipzig. 

[75] HOFFMANN, R.: Vorstellung der Professur „Sprachkommunikation“. TU Dresden, Institut für 

Arbeits-, Organisations- und Sozialpsychologie, 22. November 2004. 

[76] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: State of the art in the project 

UASR (Unified approach for speech synthesis and recognition). 11 th Int. Workshop Advances 

in Speech Technology, July 7 – 9, 2004, Maribor, Slovenia, Abstracts p. 13 – 14. 

[77] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: Vorstellung der Professur 

„Sprachkommunikation“. Gemeinsame Präsentation mit VIC Dresden, München, 24. 

November 2004. 

[78] JOKISCH, O.; STRECHA, G.; DING, H.: Multilingual speaker selection for creating a speech 

synthesis database. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004, 

Maribor, Slovenia, Abstracts p. 17 – 18. 

[79] KNÖFEL, B: Ein alternatives Berechnungsverfahren zur Körperschallausbreitung in Fahrzeugstrukturen. 

Vortrag zum Institutskolloquium. 12. Mai 2004, Institut für Akustik und 

Sprachkommunikation, TU Dresden. 

[80] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen. 

TU Dresden, Institut für Akustik und Sprachkommunikation, 7. April 2004. 

[81] KÖLTZSCH, P.: Fluglärm – Schallquellen, Belästigungen, Lärmminderung. Vorlesung im Studium 

Generale: Ringvorlesung „Interdisziplinäre Aspekte der Luft- und Raumfahrt – Das UZLR 

stellt sich vor (Universitäres Zentrum für Luft- und Raumfahrt)“, 2. November 2004. 

55


[82] KÖLTZSCH, P.: Modelle zum Problemlösen – Lösungen zum Modellproblem. Akademievorlesung 

Sommersemester 2004. Berlin-Brandenburgische Akademie der Wissenschaften, Leibnizsaal, 

13. Mai 2004. 

[83] KÖLTZSCH, P. und V. BORMANN: Optimierung mit subjektiven Zielfunktionen. Vortrag zum 

3. Workshop der BBAW-Studiengruppe „Strukturbildung und Innovation: Transdisziplinäre Aspekte, 

Analyse und Optimierung“, 11. – 13. März 2004, Berlin. 

[84] MEHNERT, D.: Experimentalphonetik in Berlin. Universität Trier, Phonetik-Workshop, 4. Juni 

2004. 

[85] MEHNERT, D.; HOFFMANN, R.; DIETZEL, R.; KORDON, U.: Acoustic experiments with 

Wethlo’s larynx model. International Workshop in Phonetics Dedicated to the Memory of 

Farkas Kempelen, March 11 – 13, 2004, Budapest, Abstracts p. 31 – 32. 

[86] MIXDORFF, H. (TFH Berlin); JOKISCH, O.: Joint international bid for hosting SPEECH 

PROSODY in Dresden, Germany, in the Spring of 2006. Int. Conf. Speech Prosody, March 23 

– 26, Nara, Japan. 

[87] PISCOYA, R.: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern. 

Projekttreffen der Forschergruppe „Combustion Noise“, Universität Karlsruhe, Engler- 

Bunte-Institut, 04. Mai 2004. 

[88] PFEIFER, G.: Der Ultraschallstrahler als Richtlautsprecher, Theorie und Praxis der Demodulation 

in Luft. Öffentlicher Fachvortrag in FH Furtwangen 02.04.2004. 

[89] PISCOYA, R. und P. KÖLTZSCH: Verbrennungslärm. Vortrag zum Institutskolloquium. 30. 

Juni 2004, Institut für Akustik und Sprachkommunikation, TU. 

[90] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Validierungen 

zum aeroakustischen Quellmechanismus an Flugzeugtragflügeln. Vortrag zum Institutskolloquium. 

10. März 2004, Institut für Akustik und Sprachkommunikation, TU Dresden. 

5.6 Patente 

[91] HÜBELT, J.; KOSTMAN, C.; STEPHANI, G.; WAAG, U.; LOTZE, G.: Schallabsorber Patentnummer 

DE10347226, Anmelder: Fraunhofer-Gesellschaft zur Förderung der angewandten 

Forschung e. V, erteilt am 16.12.2004. 

[92] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: System zur ortssensitiven Wiedergabe 

von Audiosignalen. DE 103 20 274 A1, Offenlegungsschrift vom 9. 12. 2004. 

[93] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: Audiosignal-Erkennungssystem. 

DE 103 20 209 A1, Offenlegungsschrift vom 16. 12. 2004. 

5.7 Forschungsberichte 

[94] CUEVAS, M.: FSM Language Model Using Katz’ Back-Off Method. Forschungsbericht, TU 

Dresden, IAS, August 2004. 

[95] EICHNER, M.; WOLFF, M.: eL-IT – e-Learning-Module für Studiengänge der Informations-, 

Kommunikations- und Medientechnik. Abschlussbericht zum BMBF-Projekt 08NM136C. TU 

Dresden, IAS, März 2004. 

[96] JÄCKEL, R.: Lernsystem für das Training der deutschen Aussprache. Curicukum Phonetik 

Teil 1. Forschungsbericht im Kooperationsprojekt AzAR, TU Dresden, IAS, November 2004 

[97] KÖLTZSCH, P.: Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur 

lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln. Abschlussbericht zum Forschungsprojekt, 

gefördert durch die Friedrich-und-Elisabeth-Boysen-Stiftung. 11. Oktober 

2004. 

[98] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen. 

Forschungsbericht (Auftraggeber: Gesundheitstechnik Stier), TU Dresden, IAS, März 

2004. 

[99] PISCOYA, R.; BRICK, H.; OCHMANN, M.; KÖLTZSCH, P.: Modellierung der Schallabstrahlung 

von Flammen mit akustischen Ersatzstrahlern. Forschungsbericht der Technischen 

Fachhochschule Berlin/TU Dresden 2004. 

56


Veröffentlichungen in Zeitungen und anderen Medien 

[100] HOFFMANN, R.: Pionier der technischen Sprachkommunikation verstorben. Dresdner Universitätsjournal 

15 (2004) Nr. 13, S. 7. 

[101] REPKOW, F.: Forschung wider den Lärm. Ausgründung der TUD erforscht die Akustik. 

Dresdner Universitätsjournal 15 (2004) Nr. 13, S. 8. 

[102] MAEDER, M. (Regie): Hugo Ball - Tenderenda der Phantast. Hörspielfassung mit synthetischen 

Stimmen [u. a. von DRESS]. Komposition und Produktion von Marc Matter, Marcus 

Maeder und Bernd Schurer. Schweizer Radio DRS 2, September 2004. 

[103] SCHMALFELDT, P.: Interesse auf der CeBIT. Dresdner Universitätsjournal 15 (2004) Nr. 6, S. 

10. 

[104] N. N.: eL-IT – e-Learning-Module für Studiengänge der Informations-, Kommunikations- und 

Medientechnik. Kursbuch eLearning 2004 – Produkte aus dem Förderprogramm. BMBF, Projektträger 

Neue Medien in der Bildung, 2004, S. 154 – 157. 

[105] N. N.: Forscher auf Abruf. Das Geschäftsmodell der TU Dresden. Deutschlandfunk, 

29.12.2004, Sendung „Campus und Karriere“ www.dradio.de/dlf/sendungen/campus/334665/ 

[106] N.N.: Die Semperoper - Geschichten vom Wiederaufbau SACHSENSPIEGEL REPORTAGE: 

MDR regional, 29.12.2004, 20.15 Uhr, 

5.8 Messeteilnahmen 

CeBIT 

Exponate: Integrierte Sprachtechnologielösungen 

Webbasierte Sprachdienste 

Hannover, 18. – 24. März 2004 

Expo Science Europe (ESE 2004) – European Science Forum of the Youth 

Exponat: Integrierte Sprachtechnologielösungen und webbasierte Sprachdienstleistungen. 

Dresden, Kongresszentrum, 11. Juli 2004. 

57

Promotionen und Habilitationen 

6 Promotionen und Habilitationen 

am Institut für Akustik und Sprachkommunikation 

[1] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. Dissertation, TU Dresden, 

Fakultät Elektrotechnik und Informationstechnik. Gutachter: R. HOFFMANN (TU Dresden), G. 

RUSKE (TU München), K. FELLBAUM (BTU Cottbus). Tag der Verteidigung: 09.07.2004. 

[2] LESCHKA, STEPHAN: Entwurfsmethoden und Leistungsgrenzen elektromechanischer 

Schallquellen für Ultraschallanwendungen in Gasen im Frequenzbereich um 100 kHz 

Verteidigung: 30.07.2004, Gutachter: PROF. PFEIFER, PROF. SESSLER, PROF. 

WERTHSCHÜTZKY 

[3] HAIN, H.-U.: Phonetische Transkription für ein multilinguales Sprachsynthesesystem. Dissertation, 

TU Dresden, Fakultät Elektrotechnik und Informationstechnik. Gutachter: R. 

HOFFMANN (TU Dresden), W. ZÜHLKE (TU Ilmenau), H. HÖGE (UniBW München/Siemens 

AG). Tag der Verteidigung: 23.09.2004. 

externe Gutachtertätigkeit 

[4] BERTON, A.: Konfidenzmaße und deren Anwendung in der automatischen Sprachverarbeitung. 

Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik und Wirtschaftsingenieurwesen. 

Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, Dresden. Tag der Verteidigung: 

5. 5. 2004. 

[5] HAMPICKE, M.: Optimierung von Smart-Home-Umgebungen für den Wohnbereich unter besonderer 

Berücksichtigung der elektronischen Sprachverarbeitung. Dissertation, BTU Cottbus, 

Fakultät für Maschinenbau, Elektrotechnik und Wirtschaftsingenieurwesen. Gutachter: K. 

FELLBAUM, Cottbus, R. HOFFMANN, Dresden. Tag der Verteidigung: 5. 5. 2004. 

[6] HILARIO, J. M.: Discriminative connectionist approaches for automatic speech recognition in 

cars. Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik und Wirtschaftsingenieurwesen. 

Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, Dresden. Tag der Verteidigung: 

31. 8. 2004. 

58

Diplom- und Studienarbeiten 

7 Diplom- und Studienarbeiten 

7.1 Diplomarbeiten 

[DA1] HIRSCH, STEFAN: Programm zum Praktikum „Digitale Filterung“ (Dipl.-Ing. S. Kürbis), verteidigt 

am 17.03.2004. 

[DA2] MEHNER, REINHARD: Körperschallübertragung von Sprache durch bau- und gebäudetechnische 

Strukturen in Wohn- und Industriebauten (Dr. Fuder/Dr. Joiko), verteidigt am 

07.04.2004. 

[DA3] KÜHNE, MARCO: Stimmaktivierung eines Spracherkenners (Dipl.-Ing. M. Wolff), verteidigt am 

28.04.2004. 

[DA4] SOBE, DANIEL: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit 

und Ergonomie (Dipl.-Ing. M. Eichner), verteidigt am 28.07.2004. 

[DA5] STARKE, ERIC: Vergleich von Tieffrequenz-Wiedergabesystemen nach dem Dipol- und Bassreflexprinzip 

(Prof. Pfeifer), verteidigt am 29.09.2004. 

[DA6] OTTO, BJÖRN MICHAEL: Inbetriebnahme eines Systems zur elektroakustischen Manipulation 

des Fahrzeuginnengeräuschs im Betrieb (Prof. Hoffmann, Dr. Hoffmann, DaimlerChrysler 

AG), verteidigt am 13.10.2004. 

[DA7] TRÖGE, JAN: Erarbeitung von Konzepten zur gezielten akustischen Abstimmung eines Motorlagers 

(Prof. Pfeifer,Dr. Hofmann;DaimlerCrysler AG), verteidigt am 13.10.2004. 

[DA8] SCHULZE, CHRISTIAN: Anwendung eines Mikrofonarrays zur Ortung von Schallquellen (DI 

Zeibig), verteidigt am 10.11.2004. 

[DA9] ACHILLES, STEFAN: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellen (DI 

Zeibig), verteidigt am 15.12.2004. 

[DA10] GARCIA VINAGRE, VICTOR: Generation of a Spanish Speech Database für a Text-to- 

Speech Synthesis System (Dipl.-Ing. Jokisch/Dresden), verteidigt im September 2004 Universidad 

de Valladolid (Spanien). 

[DA11] BERTOLA, VALERIO: Construction of an Italian and Spanish Diphone Data-Base for the 

DRESS Speech Synthesizer (Prof. Brofferio/Mailand; Dipl.-Ing. Jokisch/Dresden), verteidigt im 

Dezember 2004 Politecnico di Milano (Italien). 

7.2 Studienarbeiten 

[SA1] SPARMANN, J.: Neubewertung von Umgebungsschall gemäß EU-Richtlinienentwurf KOM 

2000 (468) (Dr. Fuder), verteidigt am 30.06.2004. 

[SA2] KETTLITZ, M. W.: Messtechnische Untersuchung der Schallabstrahlung von Multipolen an 

einem Tragflügelmodell (DI Witing), verteidigt am 16.07.2004. 

[SA3] HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung (Dipl.-Ing. 

Jokisch), verteidigt am 08.09.2004. 

[SA4] GEYER, T.: Softwarekomponenten zur digitalen Signalverarbeitung mit DSP zur 

Vergrößerung des Dynamikumfanges herkömmlicher ADC/DAC (Dipl.-Ing. S. Kürbis, Dipl.-Ing. 

D. Richter), verteidigt am 08.09.2004. 

[SA5] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen (Dipl.-Ing. M. Cuevas), 

verteidigt am 08.09.2004. 

[SA6] GUST, N.: Zerstörungsfreie Verbindungsprüfung bei Schichtdicken im µm-Bereich mit Hilfe 

von Ultraschall (DI Richter), verteidigt am 03.11.2004. 

[SA7] PETER, A.: Subjektive und objektive Kriterien für die akustische Qualität eines Raumes (Dr. 

Bormann), verteidigt am 10.11.2004. 

[SA8] GIESLER, J.: Modellbildung und Sensitivitätsanalyse des Schwingungsverhaltens einer Kastenstruktur 

bei hohen Frequenzen (DI Knöfel), verteidigt am 01.12.2004. 

[SA9] LÖSCHKE, H.: Minimierung der Lärmstörungen in einem Großraumbüro (Dr. Fuder), verteidigt 

am 01.12.2004. 

[SA10] LIPPMANN, M.: Untersuchungen von Hohlspiegeln mit Mehrmikrofonanlagen (DI Zeibig), 

verteidigt am 15.12.2004. 

59

Wissenschaftliche Veranstaltungen 

8 Wissenschaftliche Veranstaltungen 

8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem 

Lothar-Cremer-Preis der Deutschen Gesellschaft für Akustik 

im Jahre 2004 

Herr Dr. Ennes Sarradj, Jahrgang 1969, gehört zu den kompetentesten Nachwuchswissenschaftlern 

auf dem Gebiet der Technischen Akustik in Deutschland. Mit dem frühzeitigen Start seiner wissenschaftlichen 

Laufbahn (Promotion mit 29 Jahren) hat Herr Sarradj gegenwärtig bereits beeindruckende 

Forschungsergebnisse in der Akustik und überzeugende Aktivitäten in der Wissenschaftsorganisation 

vorzuweisen, insbesondere auf den Fachgebieten: 

• Statistische Energieanalyse und Körperschall 

• numerische Akustik (insbesondere BEM) 

• Schallabsorber, Messtechnik 

• Gehschall. 

Sein Hauptarbeitsgebiet ist das Verfahren der Statistischen Energieanalyse (SEA). Dieses Verfahren 

dient zur Untersuchung und Vorhersage des vibroakustischen Verhaltens komplexer, zusammengesetzter 

Strukturen (z. B. Maschinen, Bauwerke) bei hohen Frequenzen. Herr Dr. Sarradj hat dieses 

Verfahren um wertvolle wissenschaftliche und anwendungsorientierte Aspekte bereichert. Zur breiten 

Anwendung des Verfahrens und für einen einfachen Einstieg in die SEA hat Herr Sarradj im Internet 

eine kostenlose Software „FreeSEA“ zur Verfügung gestellt. Dabei soll durch einfache Beispiele, wie 

zur Schalltransmission zwischen benachbarten Räumen oder zur Körperschallanregung einer Karosserie, 

der „Einstieg in die Welt der SEA“ erleichtert werden. Dieses Programm wurde in den letzten 

drei Jahren weltweit von 2500 Interessenten heruntergeladen. 

Dr. Sarradj war Mitglied im – mittlerweile ausgelaufenen – thematischen EU-Netzwerk SEANET, an 

dem die TU Dresden als einzige deutsche Universität beteiligt war. Das Projekt vereinte 28 Partner 

aus 11 Ländern der EU, und zwar aus 7 Industrieunternehmen, 12 Universitäten und 9 Forschungseinrichtungen. 

Ziele des Netzwerkes waren die Bündelung der Forschung zum Thema SEA, die Anwendung 

dieses Verfahrens und die Schaffung einer allgemeinen Methodenlehre. Dr. Sarradj hat sich 

außerordentlich aktiv an den Aufgaben dieses EU-Netzwerkes beteiligt. 

Ein zweites wichtiges Arbeitsgebiet von Dr. Sarradj ist das Gebiet des Gehschalls. Im Unterschied zu 

dem bekannten und genormten Begriff Trittschall wird mit der Bezeichnung Gehschall der Lärm charakterisiert, 

der durch das Begehen eines Fußbodens im begangenen Raum entsteht. Diese Problematik 

hat durch den verstärkten Einsatz von harten und damit lauten Bodenbelägen, wie z. B. den 

Laminat-Fußböden, an Bedeutung gewonnen. 

Als Beitrag von Dr. Sarradj kann die erstmalige Behandlung dieses Phänomens gelten, für das dieser 

neue Begriff „Gehschall“ mit einem DAGA-Vortrag 2000 eingeführt wurde. Er hat die physikalischen 

Entstehungsmechanismen des Gehschalls untersucht, er hat ein Prüfverfahren entwickelt, das die 

Einschätzung der akustischen Qualität von Fußböden hinsichtlich des Gehschalls ermöglicht, er hat 

sich insbesondere auch um die messtechnische Charakterisierung von Gehschall sehr verdient gemacht. 

Ein weiteres, langjähriges Arbeitsgebiet von Herrn E. Sarradj ist das Gebiet der Schallabsorber verschiedenartigster 

Ausführungen: Faserabsorber, Schaumstoffe, offenporige Asphalte und Betone, 

Granulate und Metallfasern. Dabei besteht sein wissenschaftlicher Beitrag (insbesondere im Zusammenhang 

mit porösen Fahrbahnoberflächen) 

- im Einsatz phänomenologischer, empirischer und mikrostruktureller Theorien zur Gewinnung von 

Absorberkennwerten aus den Parametern Strömungswiderstand, Tortuosität und Porosität, 

- in der Entwicklung und Validierung von Theorien zur Vorhersage der akustisch relevanten Parameter 

aus den technologischen Parametern des zur Fahrbahnherstellung eingesetzten Mischgutes 

(Korngrößenverteilung, Bindemittelanteil, Kornform), 

- in der Entwicklung eines Mehrbereich-Randelementeverfahrens zur Berechnung des Schallfeldes 

in der Umgebung von Absorbern. 

Dr. Sarradj gehört zum kleinen Kreis technischer Akustiker, die über das Know-how der Messverfahren 

zur Tortuosität und zu den Absorberkennwerten (Wellenwiderstand und Ausbreitungskonstante) 

auf der Grundlage eigener wissenschaftlicher Arbeiten verfügen. 

60


Im Zusammenhang mit den Schallabsorbern hat Herr Dr. Sarradj große Anteile an dem Forschungsprojekt 

„Einfluss der Fahrbahneigenschaften auf das Rollgeräusch von Kraftfahrzeugen“, das von der 

Deutschen Forschungsgemeinschaft finanziert worden ist. Dieses Projekt wurde gemeinsam vom 

Fachgebiet "Technische Akustik" und dem Fachgebiet "Straßenbau" der Fakultät Bauingenieurwesen 

bearbeitet. Die Ergebnisse liefern die Grundlage für eine systematische und gezielte akustische Optimierung 

von ein- oder mehrschichtigen Fahrbahnaufbauten. 

Herr Dr. Sarradj hat sich in hohem Maße in der Lehre der Technischen Akustik betätigt. Er hat eine 

eigene Vorlesung mit dem Titel „Numerische Akustik“ aufgebaut, in der die in der Akustik verwendeten 

numerischen Verfahren behandelt und an Beispielen, in einer Projektarbeit und mit Verwendung handelsüblicher 

Softwarepakete, erprobt wurden. Dr. Sarradj war im Rahmen einer Vorlesungsreihe mit 

Vorlesungen zur Bauakustik, zur Lärmabwehr und zur Immissionsprognose beteiligt. 

Herr Sarradj hat hervorragende Organisationsfähigkeiten nachgewiesen. Bei der Einwerbung von 

Drittmitteln nahm er hinsichtlich selbständiger Kontaktanbahnung, Verhandlungsführung und Vertragsabschluss 

eine Spitzenstellung an der Fakultät ein. Dabei zeigte er ein übergewöhnliches Maß 

der Praxis des Managements und der Übernahme von Verantwortung, des Weiteren den Blick für den 

notwendigen Aufwand und, nicht unwesentlich, die erforderliche Korrektheit in den formalen Details. In 

der Logik dieser Fähigkeiten liegt seine gegenwärtige Tätigkeit: Dr. Sarradj ist seit Oktober 2002 ist 

Geschäftsführer der Gesellschaft für Akustikforschung Dresden mbH, einer stark wissenschaftlich 

orientierten Ausgründung aus dem akustischen Institut der TU Dresden. 

Durch seine hohe Fachkompetenz, seine freundliche und hilfsbereite Art sowie durch sein „Stehvermögen“ 

im wissenschaftlichen Streitgespräch werden die Zusammenarbeit mit ihm und die Mitarbeit 

unter seiner Leitung von Kollegen und Mitarbeitern als großer Gewinn empfunden. 

In der Referenz eines Fachkollegen heißt es: 

„Dr. Sarradj gehört für mich zu dem immer seltener werdenden Nachwuchs, der für theoretische Arbeiten 

in seinem Fach großes Interesse hat, gleichzeitig aber auch die ausgezeichnete Fähigkeit besitzt, 

sein theoretisches Wissen in praktischen Anwendungen umzusetzen.“ 

Und ein anderer Gutachter schreibt: 

„Von Herrn Sarradj habe ich Vorträge gehört (ICSV Stockholm, ICA Rom), die mich durch ihre didaktische 

und wissenschaftliche Qualität sehr beeindruckt haben...“ 

(P. Költzsch) 

8.2 Konferenz „Elektronische Sprachsignalverarbeitung“, 

Cottbus, 20. bis 22. September 2004 

Mit Herrn Professor Klaus Fellbaum von der Brandenburgischen TU Cottbus hatte wieder einmal einer 

der Mitbegründer unserer gemeinsamen Veranstaltungsreihe die Verantwortung für die Durchführung. 

Die Konferenz fand schon zum dritten Mal (nach 1997 und 2000) in dem sehr zweckmäßigen Hörsaalgebäude 

der BTU Cottbus statt. Insgesamt wurden 37 Vorträge und Poster in den Vortragsgruppen 

• Spracherkennung, 

• Sprachsynthese, 

• Akustik und Signalverarbeitung, 

• Technologie und Anwendung der Aprachsignalverarbeitung 

präsentiert. Als Besonderheit (gewissermaßen als Blick in die nahe Zukunft) wurde der Themenkomplex 

Mobile Computing, Ubiquitous Computing and Ambient Intelligence aufgenommen und durch die 

folgenden Hauptvorträge zur Diskussion gestellt: 

• P. Noll, TU Berlin: Sensing People – Localization with Microphone Arrays 

• C. Hentschel, BTU Cottbus: Ambient Intelligence – Vision und technische Lösungsansätze 

• A. Ullsperger, BTU Cottbus: Schlüsselinnovationen, Pilotprodukte und Thesen für Sprachverarbeitung 

bei Wearable Computing 

Der Tagungsband ist als Band 30 der „Studientexte zur Sprachkommunikation“ in der gewohnten 

Weise erschienen. 

61


8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“ am 

8. Dezember 2004 

Die Elektrotechnischen Kolloquien werden vom VDE-Bezirksverein Dresden veranstaltet. Wir nehmen 

das 469. Kolloquium in diesen Jahresbericht auf, weil es im Zusammenhang mit der Wiederbesetzung 

unserer Akustikprofessur unter der modifizierten Widmung „Kommunikationsakustik“ dazu beitrug, das 

Verständnis für das wissenschaftliche Anliegen dieses Fachgebietes zu vertiefen. Der Referent, Herr 

Prof. Dr.-Ing. Dr. techn. h. c. Jens Blauert (Ruhr-Universität Bochum), kann als Pionier der Kommunikationsakustik 

auf einen überreichen Fundus an Arbeiten zurückgreifen, die von ihm und seinen Mitarbeitern 

auf diesem Gebiet durchgeführt wurden. Er stellte daraus einen sehr informativen und anregenden 

Übersichtsvortrag zusammen. 

Um einen Eindruck vom Inhalt zu geben, drucken wir nachstehend die Abbildung und den Text ab, die 

der Autor für die Einladung zum Kolloquium zur Verfügung gestellt hatte: 

62 

Those aspects of acoustics which concern 

the relations of acoustics to the information 

and communication technologies are now 

frequently called “communication 

acoustics”. After a short review of the 

history of this field, relevant results from 

recent research at the Institute of 

Communication Acoustics at the Ruhr- 

University of Bochum, Germany, will be 

reported. This work can be seen in the light 

of the research areas of Computational 

Auditory Scene Analysis (CASA) and 

Auditory Virtual Environments (AVE) - both 

dealing with the parametric representation 

of auditory scenes. Recent application 

opportunities and future trends will be 

discussed. It will be argued that modern 

communication-acoustical systems – which 

are often only embedded components in 

more complex communication systems - 

require more and more built-in explicit 

knowledge. Among other things, the 

development of such components and 

systems calls for data and knowledge from 

the cognitive sciences.


8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“ 

Seit Dezember 2003 wird das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung 

technischer Prozesse“ gemeinsam mit der FhG EADQ Dresden bearbeitet. Am 8. Dezember 

2004 fand dazu am Institut für Akustik und Sprachkommunikation der TU Dresden das 1. Statusseminar 

statt. 

Im Rahmen des Seminars wurden folgende Vorträge gehalten: 

1. Prof. R. Hoffmann: Einführung 

2. Dr. Hentschel (FhG EADQ): Ausgewählte Aspekte des akustischen Monitoring 

3. Dr. M. Wolff: Training und Erkennung 

4. C. Tschöpe (FhG EADQ): Experimente und bisherige Ergebnisse 

5. S. Werner: Aktueller Stand des DFG-Projekts 

Das Seminar zeigtenach nunmehr einem Jahr Projektlaufzeit, dass sich die Idee der Übertragung von 

Algorithmen, die sich in der Spracherkennung bewährt haben, auf allgemeinere Probleme der Prozessanalyse 

als tragfähig erwiesen hat. Insbesondere sind dabei die Algorithmen des Strukturlernens 

zu nennen, die zuletzt in der Dissertation von M. Wolff zusammengefasst wurden. Auf dieser Basis 

wurden die folgenden Aufgaben im Rahmen des DFG-Projektes präzisiert. 

9 Institutskolloquien 

14.01.2004 

11.02.2004 

25.02.2004 

10.03.2004 

07.04.2004 

12.05.2004 

16.06.2004 

30.06.2004 

14.07.2004 

Fuder, G./Bormann, V.: 

Gesichtspunkte der Grenzwertfestlegung zur Vermeidung von Gehörschäden 

Ding, H.: 

Graphem-Phonem-Umsetzung im Chinesischen 

Hübelt, J.: 

Schallabsorber (poröse Hohlkugeln) FhG-Projekt 

Bauer, M./Zeibig, A., Költzsch, P.: 

Abschluss SWING/SWING + DFG-Verbundprojekt Aeroakustik 

Leschka, St.: 

Verfahren und Grenzen bei der Erzeugung von Ultraschall in Luft 

Knöfel, B.: 

Akustische Simulationsverfahren (Körperschall) 

Kühnicke, E.: 

Aktuelle Entwicklungen aus dem Bereich des Ultraschalls 

Folprecht, St.. 

Messfehleranalyseverfahren im Vergleich 

Brick, H., Piscoya, R., Ochmann, M., Költzsch, P.: 

Verbrennungslärm (DFG-Forschergruppe) 

63

10 Reisen 

Prof. Hoffmann 

Dipl.-Ing. Jokisch 


Prof. Mehnert 

Reisen 

Beratung zum Projekt lexDRESS 

Martin-Luther-Universität Halle 

Ehrenkolloquium Prof. Lacroix 

Goethe-Universität Frankfurt/Main 

12.01.2004 

16.01.2004 

Dipl.-Ing. Zeibig DGLR-FA-Sitzung „Fluglärm“ 30.01.2004 

Prof. Pfeifer Statuskolloquium Mikrosystemtechnik 

Karlsruhe 

Prof. Hoffmann BMBF-Gutachter-Informationsveranstaltung zum 

Programm FH³, Fachhochschule Düsseldorf 

Dipl.-Ing.Eichner IASTED International Conference on Web-Based 

Education, Innsbruck 

Prof. Hoffmann Erweiterte Vorstandssitzung der ITG 

München 

Dr.-Ing. Fuder Sitzung NALS/NATG A1 

Berlin 



Dipl.-Ing. Lachmann 

Dipl.-Ing. Strecha 

Arbeitstreffen VRDG SIEMENS 

Preparatory Meeting ECESS 

München 

Prof. Költzsch Sitzung Klasse Technikwissenschaften, Rat der Akademie 

(BBAW) 

Berlin 

Prof. Költzsch 

Dipl.-Ing. Bauer 

Dipl.-Ing. Zeibig 

SWING-Workshop 

Aachen 

Dr.-Ing. Piscoya Projekttreffen Forschergruppe „Verbrennungslärm“ 

Karlsruhe 


Prof. Mehnert 


Dr.-Ing. Bormann 

Dr.-Ing. Fuder 24. Sitzung des NVT 5 

Bremen 


MSc. Oba 

D. Sobe 

64 

International Workshop in Phonetics Dedicated to the 

Memory of Farkas Kempelen 

Hungarian Academy of Sciences, Budapest 

09.02. - 11.02.2004 

11.02.2004 

15.02. - 19.02.2004 

17.02.2004 

19.02.2004 

19.02. - 20.02.2004 

19.02. -20.02.2004 

25.02. - 29.02.2004 

04.03. - 05.03.2004 

11.03. - 13.03.2004 

3. Workshop „Strukturbildung und Innovation“ 11.03. - 13.03.2004 

CeBIT 

Hannover 

11.03. - 14.03.2004 

18.03. - 21.03.2004 

18.03. - 23.03.2004 

20.03. - 24.03.2004



Prof. Mehnert 

Dipl.-Ing. Bauer 

Dr.-Ing. Bormann 

Dr. Ding 

Dipl.-Ing. Knöfel 

Ch. Schulze 


Reisen 

Gemeinschaftstagung 

7ème Congrès Français d’Acoustique (CFA) / 

30. Deutsche Jahrestagung für Akustik (DAGA) 

Strassburg (Frankreich) 

Dipl.-Ing. Jokisch International Conference Speech Prosody 2004 

Nara (Japan) 

Dipl.-Ing. Jokisch International Symposium on Tonal Aspects of 

Languages (TAL 2004) 

Beijing (China) 

Dipl.-Ing. Werner International Conference on Information Technology 

(ITCC) 

Las Vegas (USA) 

Prof. Költzsch 44. Sitzung AK (Umweltbundesamt) 

Berlin 

Prof. Pfeifer Vortragsreihe Audiobeam 

Villingen-Schwenningen 

Dipl.-Ing. Hübelt Vortrag ICA Kyoto 

Kyoto (Japan) 

Dr.-Ing. Feldmann COST 277 (Nonlinear Speech Processing) 

Management Committee Meeting & Seminar 

Limerick (Irland) 


S. Achilles 




Projektberatung 

Braunschweig 

Themenverteidigung VRDG SIEMENS 

München 

Prof. Hoffmann Kolloquium Kommunikationsakustik 

Ruhr-Universität Bochum 

Prof. Költzsch Projektberatung Verbrennungslärm 

TFH Berlin 

Prof. Hoffmann Zukunft durch Informationstechnik 

Jubiläumsfachtagung 50 Jahre ITG 

Frankfurt/Main 

22.03. - 25.03.2004 

23.03. - 26.03.2004 

28.03. - 30.03.2004 

05.04. - 07.04.2004 

31.03.2004 

01.04. - 03.04.2004 

03.04. - 12.04.2004 

15.04. - 16.04.2004 

15.04.2004 

19.04.2004 

23.04.2004 

22.04. - 23.04.2004 

26.04. - 27.04.2004 

Dipl.-Ing. Hübelt Vortrag MEATV München 28.04.2004 

Prof. Hoffmann Festkolloquium zum 60. Geburtstag 

Prof. Fastl und Prof. Ruske 

TU München 

Prof. Hoffmann Verteidigung der Dissertationen Berton und Hampicke 

Brandenburgische TU Cottbus 

Doz. Dr. Kühnicke Vortrag zerstörungsfreie Prüfung 

Salzburg 

30.04.2004 

05.05.2004 

15.05. - 20.05.2004 

65


Dipl.-Ing. Eichner 

Dipl.-Inf. Tschöpe 

Dipl.-Ing. Werner 

Dipl.-Ing. Wolff 

Reisen 

IEEE International Conference on Acoustics, Speech, 

and Signal Processing (ICASSP) 

Montreal (Kanada) 

Dr.-Ing. Kordon Projektbesprechung mit Institut für Musik- 

instrumentenbau Zwota und Projektträger BMBF 

Markneukirchen 


Prof. Mehnert 


Prof. Mehnert 

Arbeitsbesuche T-Systems /Prof. Endres /Prof. Wolf 

TU Darmstadt / Universität Frankfurt 

Phonetik-Workshop (Prof. Köster) 

Universität Trier 

Prof. Hoffmann Verteidigung Habilitationsschrift Dr. Hollmach / 

Dissertation Ulbrich 

Martin-Luther-Universität Halle (Saale) 

Dipl.-Ing. Jokisch Kooperationsworkshop T-Systems / TU Dresden 

Dresden 

Dr.- Ing. Kordon Projektvorbereitung Musicon Valley 


Dr.-Ing. Fuder 25. Sitzung NVT 5 

Halle/Saale 

Prof. Hoffmann Conference and Workshop on Assistive Technologies 

for Vision and Hearing Impairment (CVHI 2004) 

Granada (Spanien) 

Dipl.-Ing. Jokisch Netzwerkseminar der Stiftung Industrieforschung 

Hamburg 




Dr. Ding 



Dr.-Ing. Piscoya 

Dipl.-Ing. Richter 

Tagung IC SV 11 

St. Petersburg 

11th International Workshop Advances in Speech 

Technology (AST ‘04) 

ECESS Meeting (European Center of Excellence in 

Speech Synthesis) 

University of Maribor (Slowenien) 

Messungen 

TU Darmstadt 

17.05. - 21.05.2004 

25.05.2004 

03.06.2004 

04.06.2004 

17.06.2004 

22.06.2004 

22.06.2004 

23.06. - 24.06.2004 

29.06. - 02.07.2004 

01.07. - 03.07.2004 

05.07. - 09.07.2004 

06. 07.- 08.07.2004 

14.07. - 16.07.2004 

Prof. Pfeifer Wedemark 28.07. - 29.07.2004 

Dr.-Ing. Piscoya Mitarbeitertreffen 

Aachen 


Dr.-Ing. Kordon 


Ch.Schulze 


66 

Projektbesprechung mit Institut für Musik- 

instrumentenbau Zwota und Projektträger BMBF 


Konferenz Internoise 2004 

Prag (Tschechien) 

29.07. - 30.07.2004 

04.08.04 

22.08. - 25.08.2004

Reisen 

Prof. Hoffmann Verteidigung Dissertation Hilario 





Prof. Mehnert 


München 

Historisch-Phonetische Sammlung 

Universität Hamburg 

Dr.-Ing. Feldmann COST 277-Meeting / International Summer Scholl 

„Nonlinear Speech Processing“ 

Vietri sul Mare (Italien) 




Dipl.-Ing. Kortke 

MSc. Oba 

Dipl.-Ing. Sobe 

Dr.-Ing. Wolff 

14th Czech-German Workshop “Speech Processing” 

Prag (Tschechien) 

Prof. Hoffmann Konferenz „Verarbeitung natürlicher Sprache“ 

(KONVENS), Wien 

Prof. Költzsch Projekttreffen Verbrennungslärm/Workshop 

Bad Honeff 

Dipl.-Ing. Brick 11. Workshop „Physikalische Akustik“ 

Bad Honeff 

Prof. Költzsch DLR-Kongress 





Prof. Mehnert 


M. Hofmann 


Dipl.-Ing. Sobe 




M. Lippmann 

Sitzung der ITG-Fachgruppen 4.3 und 4.4 


Konferenz „Elektronische Sprachsignalverarbeitung“ 


Abholung akustischer Hohlspiegel 

Lampertswalde 

Prof. Költzsch Ehrenkolloquium Prof. Obermeier 

Freiberg 

Dipl.-Ing. Bauer Teilnahme an Überflugmessungen 

Flughafen Coschstedt 




Dipl.-Ing. Kühne 

International Conference on Spoken Language 

Processing (ICSLP – INTERSPEECH) 

Jeju (Korea) 

25.08.2004 

26.08.2004 

06.09. - 07.09.2004 

13.09. - 18.09.2004 

13.09. - 15.09.2004 

14.09. - 17.09.2004 

15.09. - 18.09.2004 

16.09. - 18.09.2004 

20.09. - 21.09.2004 

20.09.2004 

20.09. - 22.09.2004 

24.09.2004 

24.09.2004 

30.09./02.10./03.10. 

04.10. - 08.10.2004 

67

Reisen 

Prof. Pfeifer XVIII. Messtechnisches Symposium 

Freiburg 

Prof. Hoffmann Vortrag für T-Systems, 

Customer Care Center Circle für Versicherungen 

Leipzig 

Prof. Költzsch Lehrgang „Stömungsindizierter Lärm“ 

Erlangen 

Dipl.-Ing. Zeibig Vortrag Konferenz „Saterra“ 

Mittweida 

Dipl.-Ing. Bauer Disk. akt. Forschungsaufgaben (R. Bosch GmbH) 

Stuttgart 

Dipl.-Ing. Bauer STAB-Tagung 

Bremen 

Prof. Hoffmann VDE-Kongress“Innovationen für Menschen“ 

mit ITG-Fachtagung „Ambient Intelligence“ 

Berlin 

Dipl.-Ing. Zeibig Vortrag Fo.-Kolloquium Universität Erlangen 

Erlangen 



Dipl.-Ing. Lachmann 



Dipl.-Ing. Werner 



München 

Gemeinsame Präsentation mit VIC Dresden 

München 

Dipl.-Ing. Jokisch ECESS Meeting (European Center of Excellence in 

Speech Synthesis) 

Universitat Politècnica de Catalunya, Barcelona 


Dr. Ding 


4th International Symposium on Chinese Spoken 

Language Processing 

Hongkong 

Prof. Hoffmann Ausstellung “Phonorama“ 

(Eine Kulturgeschichte der Stimme als Medium) 

Zentrum für Kunst- und Medientechnologie 

Karlsruhe 

68 

03.10. - 06.10.2004 

11.10.2004 

11.10. - 14.10.2004 

12.11.2004 

14.10. - 15.10.2004 

16.11. - 17.11.2004 

18.10. - 19.10.2004 

23.10. - 25.10.2004 

09.11.2004 

24.11.2004 

09.12. - 10.12.2004 

15.12. - 18.12.2004 

30.12.2004

Aktivitäten in der wissenschaftlichen Gemeinschaft 

11 Aktivitäten in der wissenschaftlichen Gemeinschaft 

11.1 Akademische Selbstverwaltung 

Dr.-Ing. G. Fuder 

- Mitglied der Berufungskommission „Kommunikationsakustik“ 

Prof. R. Hoffmann 

- Mitglied des Konzils der TU Dresden 

- Mitglied des Rates der Fakultät Elektrotechnik und Informationstechnik 

- Mitglied der Strukturkommission der Fakultät Elektrotechnik und Informationstechnik 

- Leiter der Studienrichtung Informationstechnik im Studiengang Elektrotechnik 

- Vorsitzender der Berufungskommission „Regelungs- und Steuerungstheorie“ 


Prof. P. Költzsch 

- Mitglied der Fakultät Maschinenwesen 

Dr.-Ing. U. Kordon 


Dr. E. Kühnicke 

- Mitglied im Promotionsausschuss der Technischen Universität Dresden 

11.2 Mitarbeit in Gremien 

Dr. V. Bormann 

- Mitglied der Deutschen Lichttechnischen Gesellschaft (LiTG), Bezirksgruppe Dresden; 

Vorstandsmitglied (Schriftführer und Schatzmeister) 

- Mitglied in REFA 

- Mitglied im Fachinstitut für Arbeitsaudit Dresden e.V. (FIAD); Geschäftsführung 

Dr. G. Fuder 

- Mitglied im DEGA-Fachausschuss „Hörakustik“ 

- Mitglied im Normausschuss NALS/NATG A 1 „Terminologie und Einheiten der Akustik“ 

- Mitglied im Normausschuss NVT 5 „Tontechnik in Theatern und Mehrzweckhallen“ 

Prof. Dr. R. Hoffmann 

- Vorsitzender des ITG-Fachausschusses 7.4 "Sprachakustik“ 

- Mitglied der ISCA Special Interest Group „Speech Synthesis“ (SynSIG) 

- Mitglied des Landesausschusses der U.R.S.I., Kommission C (Signals and Systems) 

- Gutachter im Programm des BMBF zur Förderung angewandter Forschung an Fachhochschulen 

im Verbund mit der Wirtschaft (FH³) 

- Reviewer für das Zentralblatt für Mathematik 

- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis) 

- Mitglied des Management Committee der Aktion COST 277 

Dipl.-Ing. O. Jokisch 

- Reviewer für JASA 

- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis) 

69

Aktivitäten in der wissenschaftlichen Gemeinschaft 

Prof. Dr. P. Költzsch 

- Mitglied des interdisziplinären Arbeitskreises Lärmminderungsforschung beim Umweltbundesamt 

- Mitglied der Deutschen Gesellschaft für Akustik (DEGA) 

- Mitglied des Vorstandsrates der DEGA 

- Mitglied der Jury zur Vergabe des Lothar-Cremer-Preises der DEGA bis August 2003 

- Mitglied der DEGA-Fachausschüsse „ Lehre in der Akustik“ und „Physikalische Akustik“ 

- Mitglied des Deutschen Hochschulverbandes (DHV) 

- Obmann des Normausschusses NALS/NATG A1 „Terminologie und Einheiten der Akustik“ (bis 

Februar 2003) 

- Mitglied des Facharbeitskreises „Wohngesundheit und Innenausbau“ des Arbeitsgemeinschaft 

für Bauforschung im Bundesministerium für Raumordnung, Bauwesen und Städtebau 

- Stellvertretender Obmann des Fachausschusses T 2.4 „Strömungsakustik/Fluglärm“ der DGLR 

(Deutsche Gesellschaft für Luft- und Raumfahrt) 

- Ordentliches Mitglied der Berlin-Brandenburgischen Akademie der Wissenschaften (vormals 

Preußische Akademie der Wissenschaften), Klasse Technikwissenschaften 

- Mitglied des Rates der Berlin-Brandenburgischen Akademie der Wissenschaften 

- Mitglied von „acatech“, dem Konvent für Technikwissenschaften der Union Deutscher Akademien 

der Wissenschaften 

- Gründungsmitglied des Universitären Zentrums für Luft- und Raumfahrt der Technischen Universität 


Dr. U. Kordon 

- Mitglied des ITG-Fachausschusses 7.3 „Sprachverarbeitung“ 


- Mitglied des Board of Reviewers für JASA und Wave Motion 

- Mitglied des Fachausschusses Ultraschallprüfung der DGZfP (Deutsche Gesellschaft für 

Zerstörungsfreie Prüfung) 

- Mitglied im Unterausschuss „Theoretische Modelle in der Ultraschallprüfung“ der DGZfP 

- Mitglied im DEGA-Fachausschuss Ultraschall 

- Mitglied im Ausschuss Hochschullehrer im Lehrgebiet der ZfP 

- Mitglied TIMUG (Technologien in Medizin und Gesundheitswesen) 

Prof. Dr. G. Pfeifer 

- Mitglied des Arbeitskreises „Hochschullehrer für Messtechnik“ 

- Gutachtertätigkeit für die DFG 

- Mitglied des Deutschen Hochschulverbandes (DHV) 

Dipl.-Ing. A. Zeibig 

- Mitglied AIAA (American Institute of Aeronautics and Astronautics) 

11.3 Mitarbeit in Programmkomitees 

Prof. Dr.-Ing. habil. R. Hoffmann 

- Jubiläumsveranstaltung „Zukunft durch Informationstechnik“, 50 Jahre ITG, Frankfurt, 

26. - 27.4.2004 

- KONVENS 2004, Konferenz „Verarbeitung natürlicher Sprache“, Wien, 14. – 17.9.2004 

- ESSV 2004, 15. Konferenz Elektronische Sprachsignalverarbeitung, Cottbus, 20. -22- 9.2004 

- VDE-Kongress „Innovationen für Menschen“, Fachtagung „Ambient Intelligence“ der ITG, Berlin, 

18. – 20.10.2004 

- International Conference „Speech Prosody 2006“, Dresden, 2. – 5.5.2006 (General Chair) 

Dipl.-Ing. O. Jokisch 

� International Conference „Speech Prosody 2006“, Dresden, 2. – 5.5.2006 (Technical Chair) 

70

Schlussbemerkung aus: 

Ulrich Bräker: Etwas über William Shakespeares Schauspiele … (1780) 

Reproduktion nach dem Erstdruck im Jahrbuch der deutschen Shakespeare-Gesellschaft 12 (1877). 

71

7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?