15.02.2013 Aufrufe

7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden

7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden

7 Diplom- und Studienarbeiten - IAS - Technische Universität Dresden

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Technische</strong> <strong>Universität</strong> <strong>Dresden</strong><br />

Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />

Institut für Akustik <strong>und</strong> Sprachkommunikation<br />

Jahresbericht 2004<br />

Berichtszeitraum 1.1.2004 bis 31.12.2004


Postanschrift (Briefe):<br />

<strong>Technische</strong> <strong>Universität</strong> <strong>Dresden</strong><br />

Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />

Institut für Akustik <strong>und</strong> Sprachkommunikation<br />

01062 <strong>Dresden</strong><br />

Postanschrift (Pakete):<br />

Helmholtzstr. 10<br />

01069 <strong>Dresden</strong><br />

Besucheradresse:<br />

Helmholtzstr. 18<br />

Barkhausen-Bau<br />

Sekretariat: Zi. 54<br />

Telefon: ++49 - 351 - 463 37510 (Sekretariat)<br />

++49 - 351 - 463 32747 (Institutsdirektor)<br />

Fax: ++49 - 351 - 463 37781<br />

E-Mail: Ruediger.Hoffmann@ias.et.tu-dresden.de<br />

2


Inhaltsverzeichnis<br />

Inhaltsverzeichnis<br />

Inhaltsverzeichnis ....................................................................................................... 3<br />

Vorwort ....................................................................................................................... 5<br />

1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter des Instituts für Akustik <strong>und</strong><br />

Sprachkommunikation ..................................................................................... 7<br />

1.1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „<strong>Technische</strong> Akustik“........................ 7<br />

1.2 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „Systemtheorie <strong>und</strong><br />

Sprachkommunikation“ .................................................................................... 8<br />

2 Lehre................................................................................................................ 9<br />

2.1 Vorlesungen, Übungen, Praktika ..................................................................... 9<br />

2.2 <strong>Studienarbeiten</strong>.............................................................................................. 11<br />

2.3 <strong>Diplom</strong>arbeiten............................................................................................... 11<br />

2.4 Studienwerbung............................................................................................. 12<br />

2.5 Führungen mit Demonstrationen ................................................................... 12<br />

2.6 Umsetzung des akustischen Modells der Semperoper .................................. 13<br />

3 Forschung...................................................................................................... 14<br />

3.1 AG „<strong>Technische</strong> Akustik“ ............................................................................... 14<br />

3.2 AG „Systemtheorie <strong>und</strong> Sprachkommunikation“ ............................................ 28<br />

4 Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung ................................... 48<br />

4.1 Drittmittelprojekte........................................................................................... 48<br />

4.2 Haushaltfinanzierte Forschungsaufgaben...................................................... 50<br />

5 Veröffentlichungen ......................................................................................... 51<br />

5.1 Bücher, Buchbeiträge .................................................................................... 51<br />

5.2 Veröffentlichungen in Zeitschriften................................................................. 51<br />

5.3 TU-Informationen <strong>und</strong> Lehrmaterial ............................................................... 51<br />

5.4 Vortragsveröffentlichungen ............................................................................ 52<br />

5.5 Vorträge (ungedruckt) .................................................................................... 55<br />

5.6 Patente .......................................................................................................... 56<br />

5.7 Forschungsberichte ....................................................................................... 56<br />

5.8 Veröffentlichungen in Zeitungen <strong>und</strong> anderen Medien................................... 57<br />

5.9 Messeteilnahmen........................................................................................... 57<br />

6 Promotionen <strong>und</strong> Habilitationen..................................................................... 58<br />

3


Inhaltsverzeichnis<br />

7 <strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong> ......................................................................... 59<br />

7.1 <strong>Diplom</strong>arbeiten............................................................................................... 59<br />

7.2 <strong>Studienarbeiten</strong>.............................................................................................. 59<br />

8 Wissenschaftliche Veranstaltungen ............................................................... 60<br />

8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem Lothar-<br />

Cremer-Preis der Deutschen Gesellschaft für Akustik im Jahre 2004 ........... 60<br />

8.2 Konferenz „Elektronische Sprachsignalverarbeitung“,<br />

Cottbus, 20. bis 22. September 2004............................................................. 61<br />

8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“<br />

am 8. Dezember 2004 ................................................................................... 62<br />

8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“ ........................... 63<br />

9 Institutskolloquien .......................................................................................... 63<br />

10 Reisen............................................................................................................ 64<br />

11 Aktivitäten in der wissenschaftlichen Gemeinschaft....................................... 69<br />

11.1 Akademische Selbstverwaltung ..................................................................... 69<br />

11.2 Mitarbeit in Gremien....................................................................................... 69<br />

11.3 Mitarbeit in Programmkomitees ..................................................................... 70<br />

4


Vorwort<br />

Vorwort<br />

Der 1990 aufgenommenen Tradition folgend, legt das Institut für Akustik <strong>und</strong> Sprachkommunikation<br />

seinen Partnern <strong>und</strong> Fre<strong>und</strong>en hiermit seinen 15. Jahresbericht vor.<br />

Auch in diesem Jahresbericht kann wieder eine positive Bilanz der Aktivitäten in Lehre <strong>und</strong> Forschung<br />

gezogen werden. Zu dem Blick auf das vergangene Jahr gehört aber auch, dass wir am 5. Juli 2004<br />

die traurige Nachricht erhielten, dass der langjährige Inhaber der Professur für Sprachkommunikation,<br />

Herr<br />

Prof. Dr.-Ing. habil. Walter Tscheschner,<br />

nach kurzer, schwerer Krankheit verstorben ist. Wir verdanken seinem Wirken den Aufbau des<br />

sprachtechnologischen Teiles unseres Instituts. Als 1968 das damalige Institut für <strong>Technische</strong> Akustik<br />

durch Hinzunahme weiterer Institutsteile zum Wissenschaftsbereich Kommunikation <strong>und</strong> Messwerterfassung,<br />

dem Vorgänger unseres heutigen Instituts, erweitert wurde, erfolgte damit an der TU <strong>Dresden</strong><br />

eine bemerkenswert frühzeitige Institutionalisierung der Mensch-Technik-Schnittstelle als Forschungsobjekt.<br />

Es war ein glücklicher Umstand, dass für die Komponente der Sprachkommunikation<br />

Walter Tscheschner zur Verfügung stand, der mit seinen Arbeiten über das Sprachsignal eine Entwicklungslinie<br />

zur Spracherkennung <strong>und</strong> -synthese begründete, die in unserem heutigen Institut kontinuierlich<br />

weitergeführt wird. Wir haben ihn wegen seiner herausragenden menschlichen <strong>und</strong> wissenschaftlichen<br />

Qualitäten hoch geschätzt <strong>und</strong> werden sein Andenken in Ehren halten.<br />

Im Berichtsjahr wechselte der bisherige Inhaber der Professur für <strong>Technische</strong> Akustik, Herr Prof. Dr.-<br />

Ing. habil. Peter Költzsch, zum Ende des WS 2003/04 in den Ruhestand. Über das Ehrenkolloquium<br />

zu seinem 65. Geburtstag konnte bereits im vorhergehenden Jahresbericht berichtet werden. Er war<br />

ein Jahrzehnt an unserem Institut tätig, <strong>und</strong> wir danken ihm für seine erfolgreiche Arbeit in Lehre <strong>und</strong><br />

Forschung <strong>und</strong> für seine engagierte Tätigkeit als Institutsdirektor. Wie man aus diesem Jahresbericht<br />

sieht, ist er weiterhin bei der Betreuung verschiedener Drittmittelprojekte aktiv tätig.<br />

Wie auch schon im Jahresbericht 2003 mitgeteilt werden konnte, war es trotz widriger Haushaltlage<br />

möglich, die freiwerdende Akustikprofessur unter der modifizierten Bezeichnung Kommunikationsakustik<br />

zur Nachbesetzung auszuschreiben. Im Berichtsjahr legte die Berufungskommission, die aus<br />

Vertretern eines breiten Fachspektrums zusammengesetzt war, einstimmig einen Listenvorschlag vor.<br />

Die Staatsministerin für Wissenschaft <strong>und</strong> Kunst ist diesem Vorschlag gefolgt <strong>und</strong> hat im Dezember<br />

2004 den Ruf an Frau Prof. Dr. phil. habil. Ute Jekosch erteilt. Sie ist derzeit Inhaberin einer Professur<br />

für Psychoakustik <strong>und</strong> So<strong>und</strong>design an der School of Architecture des Rensselaer Polytechnic Institute,<br />

Troy, NY.<br />

Es besteht also (trotz aller anders lautenden Gerüchte <strong>und</strong> Zweifel, die sich im vergangenen Jahr<br />

leider in der Fachwelt ausbreiteten) aller Gr<strong>und</strong> zum Optimismus, dass die Dresdner Akustik bald wieder<br />

in voller personeller <strong>und</strong> wissenschaftlicher Stärke aufgestellt sein wird. An dieser Stelle möchte<br />

ich besonders Herrn Prof. Dr.-Ing. habil. Günther Pfeifer danken, der zwischenzeitlich die Leitung der<br />

Akustikprofessur kommissarisch wahrnimmt <strong>und</strong> bereitwillig zusätzliche, umfangreiche Aufgaben in<br />

der Lehre übernommen hat. Das Institut kann dadurch auch im Übergangszeitraum, in dem die Akustikprofessur<br />

noch nicht wieder besetzt ist, seine Pflichtaufgaben in der Lehre ohne Abstriche erfüllen<br />

<strong>und</strong> zusätzlich ein breites Wahlprogramm für das Hauptstudium anbieten.<br />

Eine zusätzliche Verbreiterung der wissenschaftlichen Basis unseres Instituts wird sich durch eine<br />

vertiefte Kooperation mit dem Institut für Musikinstrumentenbau in Zwota ergeben. Mit diesem traditionsreichen<br />

Institut aus dem vogtländisch-erzgebirgischen Musikwinkel bestand bereits vor Jahren<br />

eine Zusammenarbeit auf dem Gebiet der Psychoakustik, die nun wieder aufgenommen werden soll.<br />

Der organisatorische Rahmen ist dadurch gegeben, dass die Trägereinrichtung des Instituts, der Vogtländische<br />

Förderverein für Musikinstrumentenbau <strong>und</strong> Innovation e. V. (VFMI), mit Wirkung vom<br />

2. 11. 2004 als An-Institut unserer <strong>Universität</strong> anerkannt ist. Diese Vereinbarung geht auf eine gemeinsame<br />

Initiative des VFMI, der Fakultät Elektro- <strong>und</strong> Informationstechnik, der Fakultät Maschinenwesen<br />

<strong>und</strong> der Fakultät Forst-, Geo- <strong>und</strong> Hydrowissenschaften zurück.<br />

Diese Vertiefung der Beziehungen zur Musikinstrumenten-Industrie ist ein aktuelles Beispiel für die<br />

Einbindung des Instituts in Gremien, Kooperationen <strong>und</strong> Förderprojekte, die Voraussetzung für die<br />

erfolgreiche Arbeit des Instituts ist. Wir danken allen Partnern, die uns auf vielfältige Weise unterstützt<br />

5


Vorwort<br />

haben. Ein besonderer Dank gilt wieder Frau Wilhelmine Willkomm für die stetige Förderung des wissenschaftlichen<br />

Nachwuchses.<br />

Ich möchte auch nicht versäumen, meinen Dank bei meiner langjährigen Sekretärin, Frau Uta Haase,<br />

die zum 31. März 2004 in den Ruhestand ging, abzustatten. Sie hat die Arbeitsgruppe „Systemtheorie<br />

<strong>und</strong> Sprachkommunikation“ seit 1993 mit Umsicht, Sachkenntnis, Geduld <strong>und</strong> Fre<strong>und</strong>lichkeit betreut.<br />

Für die Zukunft wünschen wir ihr alles Gute, Ges<strong>und</strong>heit <strong>und</strong> Freude.<br />

Auch in dem nun begonnenen Jahr 2005 werden die Aufgaben nicht weniger werden. Die Fakultät<br />

Elektrotechnik <strong>und</strong> Informationstechnik hat zum laufenden Wintersemester die wiederum gestiegene<br />

Zahl von 575 Studierenden immatrikuliert, so dass die Lehrnachfrage weiter gesichert ist. In der Forschung<br />

wird es neben der Weiterführung der bestehenden Projekte darum gehen, neue Vorhaben zu<br />

akquirieren, um die wissenschaftliche Arbeit weiter finanzieren zu können. In der Professur Kommunikationsakustik<br />

werden das Projekte sein, die zur Gestaltung des neuen fachlichen Profils beitragen. In<br />

der Professur Sprachkommunikation zeichnet sich u. a. eine neue vertragliche Zusammenarbeit mit<br />

osteuropäischen Partnern ab.<br />

Beim Blick auf das vor uns liegende Jahr muss die Konferenz „Elektronische Sprachsignalverarbeitung“<br />

erwähnt werden. Unser Institut ist seit 1990 an dieser jährlichen Veranstaltung beteiligt, die bisher<br />

an wechselnden Orten in Deutschland stattfand. Durch eine bereitwillige Zusage von Herrn Dr.-<br />

Ing. Dr.-Ing. E. h. R. Vích von der Tschechischen Akademie der Wissenschaften wird die 16. Konferenz<br />

in diesem Jahr im historischen Ambiente des Liechtenstein-Palais in Prag stattfinden. Sie wird<br />

vereinigt mit dem 15. Tschechisch-Deutschen Workshop „Speech Processing“ durchgeführt. Die Serie<br />

dieser Workshops pflegt besonders die Kooperation zwischen Phonetikern <strong>und</strong> Ingenieuren, die somit<br />

auch einen Schwerpunkt unserer Konferenz bilden wird. Ich bin sicher, dass der glanzvolle Ort der<br />

Konferenz diesmal eine besondere Anziehungskraft beweisen wird, <strong>und</strong> lade Sie herzlich ein, die Veranstaltung<br />

durch Ihre aktive Teilnahme auch inhaltlich zu einem Höhepunkt werden zu lassen. Der<br />

Termin ist der 26. - 28. September 2005. Nähere Informationen finden Sie unter<br />

www.ias.et.tu-dresden.de/essv2005 oder www.ias.et.tu-dresden.de/essp2005.<br />

Zum Konferenzgeschehen kann weiter berichtet werden, dass sich unser Institut im Jahre 2004 an der<br />

internationalen Ausschreibung zur Konferenz Speech Prosody 2006 beteiligt <strong>und</strong> den Zuschlag bekommen<br />

hat. Wir freuen uns über diesen Erfolg besonders deshalb, weil es erstmals gelungen ist,<br />

eine größere internationale Konferenz an unser Institut zu holen, <strong>und</strong> danken allen Fachkollegen <strong>und</strong><br />

Institutionen, die diese Bewerbung unterstützt haben. Die Konferenz ist eine Veranstaltung der SPro-<br />

SIG (ISCA Special Interest Group on Speech Prosody) <strong>und</strong> wird vom 2. bis zum 5. Mai 2006 im neu<br />

errichteten Konferenzzentrum am <strong>Dresden</strong>er Elbufer stattfinden. Nähere Informationen bietet<br />

www.ias.et.tu-dresden.de/sp2006.<br />

Am Ende dieser einführenden Worte soll ein kleiner Hinweis zur Traditionspflege stehen. Unser Institut<br />

bewahrt das Gipsmodell der <strong>Dresden</strong>er Semperoper, das für die akustische Projektierung des Wiederaufbaus<br />

des 1945 zerstörten, legendären Opernhauses angefertigt wurde. Seit 2004 steht es öffentlich<br />

zugänglich im Eingangsbereich des Institutes. Über die vorher erforderliche Restaurierung des<br />

Modells wird in diesem Jahresbericht in Abschnitt 2.6 berichtet. Ein schöner Zufall wollte es, dass<br />

etwa zeitgleich der Mitteldeutsche R<strong>und</strong>funk an einem Fernsehbeitrag über den 1985 abgeschlossenen<br />

Wiederaufbau der Oper arbeitete <strong>und</strong> dabei Herrn Professor Kraak um Erläuterungen zur akustischen<br />

Komponente bat. So war es möglich, ihn <strong>und</strong> das erneuerte Modell am 29. Dezember 2004 am<br />

Bildschirm in einem Beitrag zu erleben, der neben der Sachinformation auch das sprichwörtliche<br />

<strong>Dresden</strong>er Traditionsbewusstsein zum Ausdruck brachte.<br />

Allen Mitgliedern <strong>und</strong> Fre<strong>und</strong>en unseres Instituts wünsche ich ein erfolgreiches <strong>und</strong> ges<strong>und</strong>es Jahr<br />

2005.<br />

Im Januar 2005 Rüdiger Hoffmann<br />

6


Mitarbeiterinnen <strong>und</strong> Mitarbeiter<br />

1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter des Instituts für Akustik<br />

<strong>und</strong> Sprachkommunikation<br />

Institutsdirektor<br />

Prof. Dr.-Ing. habil. Rüdiger Hoffmann<br />

1.1 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „<strong>Technische</strong> Akustik“<br />

Hochschullehrerinnen <strong>und</strong> Hochschullehrer<br />

Prof. Dr.-Ing. habil. Peter Költzsch Leiter der AG (bis 31.03.2004)<br />

im Ruhestand (ab 01.04.2004)<br />

Telefon<br />

33041<br />

apl. Prof. Dr.-Ing. habil. Günther Pfeifer Leiter der AG (ab 01.04.2004)<br />

bis zur Wiederbesetzung<br />

32205<br />

Doz. Dr.-Ing. habil. Elfgard Kühnicke 32894<br />

Prof. Dr.-Ing. habil. Wolfgang Kraak im Ruhestand seit 1988<br />

Prof. Dr.-Ing. habil Arno Lenk im Ruhestand seit 1996<br />

Prof. Dr.-Ing. habil Walter Wöhle im Ruhestand seit 1993<br />

Wissenschaftliche Mitarbeiter<br />

Dr.-Ing. Günther Fuder 35374<br />

Wissenschaftliche Mitarbeiterinnen <strong>und</strong> Mitarbeiter auf Drittmittelstellen, Doktoranden<br />

Dipl.-Ing. Marcus Bauer DFG 33041<br />

Dr.-Ing. Volker Bormann (bis 31.05.2004) B<strong>und</strong>esanstalt f. AuA, BBAW u. a. 32509<br />

Dipl.-Ing. Haike Brick DFG 34294<br />

Dipl.-Ing Stefan Folprecht (bis 30.11.2004) DFG 32253<br />

Dipl.-Ing Jörn Hübelt (bis 31.10.2004) DFG/FhG 32449<br />

Dipl.-Ing. Björn Knöfel BMBF 35524<br />

Dr.-Ing. Rafael Piscoya Rodriguez DFG 35524<br />

Dipl.-Ing. Dietmar Richter DFG/Microtech Gefell GmbH 32275<br />

Dipl.-Ing. Eric Starke (ab 01.10.2004) SFB 639 32253<br />

Dipl.-Ing. Andreas Zeibig DFG/DLR 32509<br />

Ingenieure<br />

Dipl.-Ing. (FH) Jürgen Landgraf 33521<br />

Dipl.-Ing. Andreas Witing 33547<br />

Promotionsstudenten/Stipendiaten<br />

Dipl.-Ing. Stephan Leschka (bis 30.04.2004) 32253<br />

Sekretärin/Institutssekretariat<br />

Frau Lianne Domaschke 37510<br />

7


Mitarbeiterinnen <strong>und</strong> Mitarbeiter<br />

1.2 Mitarbeiterinnen <strong>und</strong> Mitarbeiter der AG „Systemtheorie <strong>und</strong><br />

Sprachkommunikation“<br />

Hochschullehrer<br />

Telefon<br />

Prof. Dr.-Ing. habil. Rüdiger Hoffmann Leiter der AG 32747<br />

Prof. em. Dr.-Ing. habil. Dieter Mehnert Externer Mitarbeiter<br />

Wissenschaftliche Mitarbeiter<br />

Dr.-Ing. Ulrich Kordon 32240<br />

Dipl.-Ing. Matthias Eichner (bis 30.09.2004) anschließend GWT 36298<br />

Dipl.-Ing. Mathias Kortke 34849<br />

Dr.-Ing. Matthias Wolff 36298<br />

Projektmanager Signalverarbeitung <strong>und</strong> Mustererkennung der Gesellschaft für Wissens- <strong>und</strong><br />

Technologietransfer mbH der TU <strong>Dresden</strong><br />

Dipl.-Ing. Oliver Jokisch 32289<br />

Ingenieure<br />

Dipl.-Ing. Steffen Kürbis 33395<br />

Dipl.-Ing. (FH) Margitta Lachmann GWT 34283<br />

Mitarbeiter auf Drittmittelstellen bzw. Promotionsstudenten<br />

Dipl.-Ing. Maximiliano Cuevas DFG 34839<br />

Dr. phil. Hongwei Ding GWT 34283<br />

Dr.-Ing. Ute Feldmann Habil.-Stipendiatin 32721<br />

MSc. Hamurabi Gamboa Rosales Stipendiat 33106<br />

Dipl.-Ing. Hussein Hussein Stipendiat 32721<br />

Dipl.-Slaw. Rainer Jäckel GWT 32799<br />

MSc. Toshifumi Oba DFG 33106<br />

Dipl.-Ing. Guntram Strecha Siemens 34849<br />

Dipl.-Inf. Constanze Tschöpe DFG (FhG) 34839<br />

Dipl.-Ing. Steffen Werner DFG 32799<br />

Sekretärinnen<br />

Frau Uta Haase (bis 31.03.2004) 37656<br />

Frau Barbara Wrann 37656<br />

8


2 Lehre<br />

Lehre<br />

2.1 Vorlesungen, Übungen, Praktika<br />

Im Sommersemester 2004 <strong>und</strong> im Wintersemester 2004/2005 wurden die folgenden Lehrveranstaltungen<br />

durchgeführt:<br />

2.1.1 Pflichtfächer im Gr<strong>und</strong>- <strong>und</strong> Hauptstudium<br />

Vorlesung „Systemtheorie I“ (Prof. R. Hoffmann) WS 04/05<br />

2 SWS Vorlesung,1 SWS Übung 3. Semester<br />

Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 550 Hörer<br />

<strong>und</strong> Nebenfach<br />

Vorlesung „Systemtheorie II“ (Prof. R. Hoffmann) SS 04<br />

2 SWS Vorlesung,2 SWS Übung 4. Semester<br />

Studiengänge: Elektrotechnik, Informationssystemtechnik, Mechatronik 450 Hörer<br />

<strong>und</strong> Nebenfach<br />

Vorlesung „Systemtheorie III“ (Prof. R. Hoffmann) WS 04/05<br />

2 SWS Vorlesung, 2 SWS Übung 5. Semester<br />

Studienrichtung Informationstechnik 80 Hörer<br />

Vorlesung „Signal Processing“ (Prof. R. Hoffmann) SS 04<br />

2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />

Master-Studiengang 5 Hörer<br />

Vorlesung „Signalverarbeitung“ (Prof. R. Hoffmann) WS 04/05<br />

2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />

Studienrichtung Informationstechnik, Studiengang Informationssystemtechnik, 100 Hörer<br />

Master-Studiengang <strong>und</strong> Nebenfach<br />

Vorlesung „Akustik“ (Prof. G. Pfeifer) WS 04/05<br />

2 SWS Vorlesung, 1 SWS Übung 5. Semester<br />

Studienrichtung Informationstechnik, Bakkalaureat Informations- <strong>und</strong> 67 Hörer<br />

Mikroelektronik, Nebenfach für Medieninformatik <strong>und</strong> Informatik,<br />

Master-Studiengang<br />

Praktikum „Computertechnik“ (Mitwirkung) SS 04<br />

Studiengang Elektrotechnik 2. Semester<br />

Versuch “Beurteilung der Klangfarbe von überlagerten Sinustönen”<br />

(Dipl.-Ing. A. Witing) 65 Teilnehmer<br />

Versuch „Akustischer Schalter“ (Dr. Kordon <strong>und</strong> Mitarb.) 80 Teilnehmer<br />

2.1.2 Wahlobligatorische Fächer (AG <strong>Technische</strong> Akustik)<br />

Vorlesung „<strong>Technische</strong> Akustik“ (Prof. G. Pfeifer) SS 04<br />

2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />

13 Hörer<br />

Vorlesung „Elektroakustik I“ (Prof. G. Pfeifer) SS 04<br />

2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />

18 Hörer<br />

Vorlesung „Theoretische Akustik“ (Doz. Dr. Kühnicke) SS 04<br />

2 SWS Vorlesung 8. Semester<br />

5 Hörer<br />

9


Lehre<br />

Vorlesung „Raumakustik <strong>und</strong> Beschallungstechnik“ (Dr. Ederer/Dr. Roy) SS 04<br />

2 SWS Vorlesung 8. Semester<br />

16 Hörer<br />

Vorlesung „Ultraschall II“ (Doz. Dr. E. Kühnicke) SS 04<br />

2 SWS Vorlesung 8. Semester<br />

5 Hörer<br />

Vorlesung „Elektromechanische Messtechnik“ (Prof. G. Pfeifer) SS 04<br />

2 SWS Vorlesung 6./8. Semester<br />

4 Hörer<br />

Vorlesung „Mechanische <strong>und</strong> elektronische Klangerzeugung SS 04<br />

bei Musikinstrumenten“ (Doz. Dr. E. Kühnicke) 40 Hörer<br />

2 SWS Vorlesung<br />

Praktikum „Computertechnik“ (Dipl.-Ing. A. Witing) SS 04<br />

Studiengang Elektrotechnik 2. Semester<br />

Versuch „Beurteilung der Klangfarbe von überlagerten Sinustönen“ 48 Hörer<br />

Praktikum „Akustik“ WS 04/05<br />

(Prof. R. Hoffmann/Prof. P. Költzsch/Prof. G. Pfeifer) 7. Semester<br />

4 SWS Praktikum (Dr. Fuder) 10 Hörer<br />

Seminar „Schallmesspraxis“ (Dr. G. Fuder) WS 04/05<br />

1 SWS Seminar, 1 SWS Praktikum 7. Semester<br />

18 Hörer<br />

Vorlesung „Elektroakustik II“ (Prof. G. Pfeifer) WS 04/05<br />

2 SWS Vorlesung, 2 SWS Übung 7. Semester<br />

7 Hörer<br />

Vorlesung „Ultraschall I – Gr<strong>und</strong>lagen“ (Doz. Dr. E. Kühnicke) WS 04/05<br />

2 SWS Vorlesung 7. Semester<br />

12 Hörer<br />

2.1.3 Wahlobligatorische Fächer (AG Systemtheorie <strong>und</strong><br />

Sprachkommunikation)<br />

Vorlesung „Signalanalyse <strong>und</strong> –erkennung“ (Prof. Hoffmann) SS 04<br />

2 SWS Vorlesung, 1 SWS Übung 6. Semester<br />

15 Hörer<br />

Vorlesung „Psychoakustik“ (Dr. Kordon) SS 04<br />

2 SWS Vorlesung 6. Semester<br />

74 Hörer<br />

Vorlesung „<strong>Technische</strong> Sprachkommunikation“ (Dr. Kordon) SS 04<br />

2 SWS Vorlesung 6. Semester<br />

21 Hörer<br />

Praktikum „<strong>Technische</strong> Sprachkommunikation“ (Dr. Kordon) WS 04/05<br />

3 SWS Praktikum 7. Semester<br />

9 Teilnehmer<br />

Vorlesung „Spracherkennung I“ (Dr. Kordon) WS 04/05<br />

2 SWS Vorlesung 7. Semester<br />

10 Hörer<br />

10


Lehre<br />

Vorlesung „Spracherkennung II“ (Dr. Flach, FhG) SS 04<br />

2 SWS Vorlesung 8. Semester<br />

4 Hörer<br />

Vorlesung „Sprachsynthese“ (Dr. Kordon) WS 04/05<br />

1 SWS Vorlesung 7. Semester<br />

26 Hörer<br />

Seminar „Signalprozessoren in der Audio-Signalverarbeitung“ (Dipl.-Ing. Kürbis) WS 04/05<br />

1 SWS Seminar, 1 SWS Praktikum 7. Semester<br />

10 Hörer<br />

Vorlesung „Chaos/Nichtlineare Systeme“ (Dr. Feldmann) WS 04/05<br />

2 SWS Vorlesung 7 Semester<br />

8 Hörer<br />

Hauptseminar „Systemtheorie/Sprachtechnologie“ (Prof. Hoffmann/Dr. Feldmann) WS 04/05<br />

1SWS Seminar 7 Semester<br />

5 Teilnehmer<br />

2.1.4 Lehrveranstaltungen für andere Studiengänge<br />

Vorlesung „Elektromechanische Netzwerke“ (Prof. G. Pfeifer) WS 04/05<br />

2 SWS Vorlesung, 1 SWS Übung 7. Semester<br />

Fakultät Elektrotechnik, Studiengang Mechatronik 17 Hörer<br />

Vorlesung „Musikalische Akustik/Physiologische Akustik“ SS 04<br />

(Dipl.-Phys. A. Wilde, Prof. G. Hofmann) 47 Hörer<br />

1 SWS Vorlesung<br />

Fakultät Informatik/Nebenfach für Studiengang Medieninformatik <strong>und</strong> Informatik<br />

Vorlesung „Physikalische Gr<strong>und</strong>lagen der Akustik“ (Doz. Dr. E. Kühnicke) WS 04/05<br />

2 SWS Vorlesung, 1 SWS Übung 3. Semester<br />

Fakultät Informatik/Studiengang Medieninformatik <strong>und</strong> Informatik 56 Hörer<br />

Vorlesung „Signale <strong>und</strong> Systeme“ (Dr. U. Feldmann) SS 04<br />

2 SWS Vorlesung, 1 SWS Seminar, 1 SWS Praktikum 4. Semester<br />

Berufsakademie Sachsen (BA), Informationstechnik 37 Hörer<br />

2.2 <strong>Studienarbeiten</strong><br />

Im Berichtszeitraum wurden am Institut für Akustik <strong>und</strong> Sprachkommunikation 10 <strong>Studienarbeiten</strong><br />

angefertigt. Die Themen, die Bearbeiter <strong>und</strong> die Betreuer der Arbeiten sind im Abschnitt 7.2 aufgeführt.<br />

2.3 <strong>Diplom</strong>arbeiten<br />

Im Jahr 2003 wurden am Institut für Akustik <strong>und</strong> Sprachkommunikation 9 <strong>Diplom</strong>arbeiten verteidigt.<br />

Zwei ausländische Studenten fertigten ihre <strong>Diplom</strong>arbeiten am Institut an. Diese wurden jeweils an der<br />

Heimatuniversität verteidigt. Die Themen, die Bearbeiter <strong>und</strong> die Betreuer aller <strong>Diplom</strong>arbeiten sind im<br />

Abschnitt 7.1 zusammengestellt.<br />

11


2.4 Studienwerbung<br />

Lehre<br />

• Schnupperstudium am 15. Januar 2004<br />

Vorlesungen<br />

Vorlesung Akustik (mit Experimenten) Prof. Költzsch<br />

Besichtigungen<br />

Labor für Spracherkennung <strong>und</strong> –synthese Dr. U. Kordon<br />

Audioschallerzeugung mittels Ultraschall Dipl.-Ing. S. Folprecht<br />

Akustische Messräume (schalltoter Raum <strong>und</strong> Hallraum, Dipl.-Ing. A. Witing/<br />

Audio-/video-Labor, Experimente im aerodynamischen Windkanal) Dipl.-Ing. D. Richter/<br />

Dipl.-Ing. A. Zeibig<br />

Akustisches Modell der Semperoper <strong>Dresden</strong> Dipl.-Ing. D. Richter<br />

� „Uni-Tag“ am 24. April 2004<br />

Besichtigungen/ Vorführungen:<br />

Labor für Spracherkennung <strong>und</strong> Sprachsynthese Dr. U. Kordon<br />

Modell der Semperoper <strong>Dresden</strong> Dr. G. Fuder<br />

Hallraum, großer schalltoter Raum Dipl.-Ing. A. Witing<br />

• Sommeruniversität 2004<br />

Es fanden vier Veranstaltungen im Juli 2004 (08.07., 15.07., 22.07., 29.07.2004) im Rahmen der<br />

Sommeruniversität statt.<br />

Einführungsvorträge: „Einführung in die Akustik“ Dr. Fuder<br />

„Sprachanalyse <strong>und</strong> Sprachsynthese“ Dr. Kordon<br />

Besichtigungen:<br />

Labor für Spracherkennung <strong>und</strong> Sprachsynthese, Modell der Semperoper<br />

Akustische Messräume: Hallraum, großer schalltoter Raum, Windkanal<br />

Teilnehmer: jeweils 2 Gruppen (insgesamt 33 Abiturientinnen, Schülerinnen <strong>und</strong> Schüler)<br />

• Betreuung von Schülern<br />

Vier Schüler der 9. Klasse absolvierten am Institut ein zweiwöchiges Betriebspraktikum. In dieser Zeit<br />

wurden u.a.eine Multimedia-CD zur akustischen Erprobung der Semperoper erstellt <strong>und</strong> grafische<br />

Vorlagen zur Ansteuerung eines historischen Sprachsynthesesystems erarbeitet.<br />

2.5 Führungen mit Demonstrationen<br />

Die Teilnehmer erhielten eine Einführung in die Struktur sowie die fachlichen Aufgaben des Instituts<br />

<strong>und</strong> lernten die Studien- <strong>und</strong> Forschungsmöglichkeiten am Institut kennen. Es wurden akustische<br />

Spezialräume <strong>und</strong> Labors besichtigt sowie Verfahren der Sprachsynthese/Sprachanalyse<br />

demonstriert.<br />

• Führung von 80 Schülern des Gymnasiums Klotzsche<br />

Termin: 01.10.2004<br />

• Führung von 50 Schülern des Gymnasiums Klotzsche<br />

Termin: 04.10.2004<br />

� Einen besonderen Besucheransturm von über 300 Besuchern erlebte das Institut anlässlich der<br />

„Langen Nacht der Wissenschaften“, die am 25. Juni 2004, die gemeinsam von den Dresdner<br />

Wissenschaftseinrichtungen organisiert worden war.<br />

Unter der Überschrift „Experimente im Akustiklabor“ wurden<br />

o die Besichtigung des großen reflexionsarmen Raumes mit Demonstration des synthetischen<br />

Schallfeldes – Simulation des Höreindrucks in Räumen <strong>und</strong><br />

o Experimente im Spracherkennungs- <strong>und</strong> Sprachsyntheselabor<br />

angeboten.<br />

12


Lehre<br />

2.6 Umsetzung des akustischen Modells der Semperoper<br />

Das Modell entspricht im Maßstab 1:20 dem Zustand des Zuschauerraumes der Semperoper vor der<br />

Zerstörung im II. Weltkrieg <strong>und</strong> diente der Ermittlung der ursprünglichen raumakustischen Kennwerte.<br />

Heute wird das Modell zur Erklärung der Modellmesstechnik innerhalb von Institutsführungen verwendet.<br />

Vor seiner Umsetzung stand das Opernmodell im so genannten Modellmessraum. Da dieser<br />

Raum gegenwärtig für andere Forschungsvorhaben genutzt wird <strong>und</strong> um dem Modell einen würdigeren<br />

Rahmen zu geben, sollte es in das Treppenfoyer im Sockelgeschoss des Barkhausenbaus umgesetzt<br />

werden. Nach Abnahme der Modellmaße wurde klar, dass das Modell durch keine Tür im Hause<br />

passt. In seiner Weitsicht bei der Projektierung des Modellmessraumes hatte Prof. W. Reichardt ein<br />

großes Fenster mit einer demontierbaren Mittelstrebe ausführen lassen, um große Modelle rein- <strong>und</strong><br />

rauszutransportieren. Also hätten auch wir das Modell aus dem Barkhausenbau wieder herausbekommen<br />

– aber eben nicht wieder in das Foyer herein. So musste es also in mehrere Teile zerlegt<br />

werden. Da dies bei der Kompliziertheit der filigranen Gipskonstruktion kein einfaches Unterfangen<br />

war, zogen wir Experten zu Rate. Besonders den Fähigkeiten des bekannten Dresdner Bildhauers<br />

Vincenz Wanitschke ist es zu danken, dass die Zerlegung <strong>und</strong> Montage des Opernmodells gelang.<br />

Bildhauer Vincenz Wanitschke vor dem zerlegten Modell <strong>und</strong> aufgereihte Einzelteile<br />

Heute können wir das durch Institutsmitarbeiter eingehauste Modell wieder in voller Schönheit im Foyer<br />

bew<strong>und</strong>ern. Zwei außen angebrachte Poster informieren zur Historie <strong>und</strong> zur Modellmesstechnik.<br />

Prof. W. Kraak, Leiter der akustischen Untersuchungen der Semperoper, vor dem Modell<br />

Prof. W. Kraak hielt am 9. Dezember 2004 im Rahmen der Vorlesung „Akustik“ einen Vortrag zum<br />

Thema: „Akustik der Semperoper“.<br />

(Dipl.-Ing. J. Landgraf)<br />

13


3 Forschung<br />

3.1 AG „<strong>Technische</strong> Akustik“<br />

3.1.1 Verbrennungslärm<br />

Forschung<br />

Verbrennungslärm: Schallabstrahlung offener Jet–Diffusionsflammen<br />

In den ersten zwei Jahren des Forschungsprojektes „Modellierung der Schallabstrahlung von Flammen<br />

mit akustischen Ersatzstrahlern“ wurde vor allem die Anwendbarkeit der Ersatzstrahlermethode,<br />

/3/, (ESM) für freie Flammen untersucht. Parallel wurde ein Bo<strong>und</strong>ary-Elemente-Methode, /4/, (BEM)–<br />

Code entwickelt, um die Ergebnisse der ESM-Berechnungen verifizieren zu können. Das Forschungsprojekt<br />

ist ein Teilprojekt der von der DFG geförderten, überregionalen Forschergruppe „Combustion<br />

Noise“ /1/.<br />

Die Berechnung der Schallabstrahlung erfolgt nach einem Hybridverfahren, welches aus zwei Schritten<br />

besteht: 1.) die Bestimmung der akustischen Größen im Nahfeld <strong>und</strong> 2.) die Berechnung des<br />

Schallfeldes im Fernfeld. Der Gr<strong>und</strong> dieser Teilung liegt im Unterschied der Zeit-, Raum- <strong>und</strong> Energieskalen<br />

von Strömung <strong>und</strong> Schallausbreitung begründet. In der Strömung befinden sich kleine Strukturen<br />

mit viel Energie, die sich mit kleiner konvektiver Geschwindigkeit ausbreiten. Der abgestrahlte<br />

Schall hat kleine Amplituden <strong>und</strong> trägt wenig Energie, besitzt aber große Wellenlängen aufgr<strong>und</strong> der<br />

hohen Ausbreitungsgeschwindigkeit.<br />

Die Schnelle im Nahfeld, d.h. der erste Schritt des Verfahrens, wird mit Hilfe einer Large-Eddy-<br />

Simulation berechnet, die das kooperierende Teilprojekt „Modellierung von Schallquellen in Verbrennungssystemen<br />

mit Hilfe der Grobstruktursimulation“ an der TU Darmstadt, Fachgebiet Energie- <strong>und</strong><br />

Kraftwerkstechnik, durchführt.<br />

Nach einer Anpassung der geometrischen LES-Rechengitter an die Anforderungen der ESM bzw.<br />

BEM <strong>und</strong> der Fouriertransformation der Schnelledaten im Zeitbereich in Schnellespektren kann das<br />

Schallfeld im Fernfeld bestimmt werden.<br />

Zur Validierung der Ergebnisse wurde die abgestrahlte Schallleistung der simulierten Flammen mit der<br />

Intensitätsmessmethode am Darmstädter Institut vermessen. Abb.1 zeigt den Brenner <strong>und</strong> das Messgitter.<br />

Abbildung 1 Messung der<br />

Schallleistung der Jet-<br />

Diffusionsflamme (HD-<br />

Flamme) mit der Intensitätsmessmethode<br />

Die untersuchte Diffusionsflamme ist durch die folgenden Größen charakterisiert: Brennstoff 23% H2 /<br />

77% N2, Re = 16.000, Düsendurchmesser D = 8 mm,<br />

Austrittsgeschwindigkeit Ubulk = 36,3 m/s (HD-Flamme in /2/).<br />

In Abb. 2 sind die Messergebnisse für die HD-Flamme sowie die Berechnungsergebnisse der beiden<br />

akustischen Methoden dargestellt. Es ist zu sehen, dass die Simulationen die tatsächliche Schallabstrahlung<br />

der Flamme überschätzen, <strong>und</strong> zwar um maximal 5 dB. Der qualitative Verlauf der Kurve<br />

wird im tieferen <strong>und</strong> mittleren Frequenzbereich mit der BEM erstaunlich gut wiedergegeben. Die Ergebnisse<br />

der ESM weichen im tieferen Frequenzbereich etwas stärker von der gemessenen Kurve ab,<br />

14


Forschung<br />

die Ursache ist in der schlechten Konditionierung des Gleichungssystems bei tieferen Frequenzen zu<br />

suchen.<br />

Abbildung 2<br />

Terzspektren der abgestrahlten<br />

Schallleistung der HD-<br />

Flamme,<br />

– gemessen, -- mit BEM <strong>und</strong><br />

.- mit ESM berechnet.<br />

Ab ca. 2000 Hz folgen die simulierten Kurven nicht mehr dem Abfall des gemessenen Frequenzganges.<br />

Die Ursachen für diese Abweichungen konnten bisher nicht abschließend geklärt werden. Auch<br />

andere Autoren beschreiben das Auftreten dieses hochfrequenten Störlärms bei Berechnung der<br />

Schallabstrahlung auf der Gr<strong>und</strong>lage von Large-Eddy-Simulationen /5/. Eine Untersuchung der möglichen<br />

Ursachen für diese signifikante qualitative Abweichung sowie die Erweiterung der Methoden auf<br />

die Berechnung der Schallabstrahlung eingeschlossener Flammen ist für die folgende Projektphase<br />

geplant.<br />

(Dipl.-Ing. Haike Brick, Dr.-Ing. Rafael Piscoya)<br />

3.1.2 Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen<br />

<strong>und</strong> Oberflächendruckfelder (SWING+)<br />

Im Rahmen des DFG-Paketantrages „Numerische Aeroakustik für Verkehrsflugzeuge (SWING+)“<br />

wurde im Zeitraum von 2001 bis 2004 das Projekt Schallquellenmodellierung mittels stochastischer<br />

Geschwindigkeitsschwankungen <strong>und</strong> Oberflächendruckfelder“ bearbeitet (Dr. Nikolai Kalitzin, Dipl.-<br />

Ing. Marcus Bauer, Dipl.-Ing. Andreas Zeibig, Dipl.-Ing. Dietmar Richter, Dipl.-Ing. Andreas Witing, Dr.<br />

Andriy Borisyuk), <strong>und</strong> zwar gemeinsam mit den Partnern: Institut für Aerodynamik <strong>und</strong> Gasdynamik<br />

der <strong>Universität</strong> Stuttgart, Aero-dynamisches Institut der RWTH Aachen, Hermann-Föttinger- Institut für<br />

Strömungsmechanik der TU Berlin, Institut für Aerodynamik <strong>und</strong> Strömungstechnik des DLR Braunschweig.<br />

Die Zielsetzung des TU-Projektes war die Weiterentwicklung, Verifizierung <strong>und</strong> Validierung des<br />

SNGR-Modells für einen CAA-Code <strong>und</strong> dessen exemplarische Anwendung zur Berechnung des Geräusches<br />

der Klappenseitenkantenströmung bzw. deren einzelnen Modellstufen.<br />

Arbeitshypothesen:<br />

- EULER-Gleichungen mit Quellgliedern können zur Berechnung strömungsakustischer Felder<br />

eingesetzt werden. Eine Aufspaltung der Variablen in einen zeitgemittelten <strong>und</strong> einen<br />

Schwankungsanteil ist sinnvoll.<br />

- Reale Turbulenz kann im Hinblick auf das o. g. Ziel durch stochastische, synthetische Geschwindigkeitsschwankungen<br />

unter Verwendung klassischer Turbulenzspektren<br />

(z. B. von-Kármán-Spektrum) nachgebildet werden.<br />

- Druckfelder auf der Oberfläche bzw. im Nahbereich von umströmten Körpern bilden prinzipiell<br />

das akustische Quellgeschehen ab <strong>und</strong> sind deshalb zur Quellmodellierung bei hybriden Verfahren<br />

(Aeroakustische Analogie) einsetzbar.<br />

- Numerische Verfahren <strong>und</strong> deren Lösungen gewinnen erst dadurch an Bedeutung, dass ihre<br />

Ergebnisse durch Messungen validiert worden sind.<br />

15


Forschung<br />

- Zur Validierung der Projektergebnisse sind aerodynamische, strömungsakustische <strong>und</strong> akustische<br />

Messungen durchzuführen. Dafür sind geeignete Messmethoden <strong>und</strong> Versuchsaufbauten<br />

zu realisieren bzw. neu zu entwickeln.<br />

In den drei Hauptabschnitten des TU-Projektes wurden folgende Ergebnisse erreicht:<br />

Schallquellenmodellierung: stochastische Geschwindigkeitsschwankungen (numerisches Verfahren:<br />

CAA-Modul: SNGR)<br />

Das ursprüngliche SNGR-Modell (Stochastic Noise Generation and Radiation) weist einige Unzulänglichkeiten<br />

auf: anfechtbare Gr<strong>und</strong>gleichungen, Vermischung von Schall- <strong>und</strong> Turbulenzvorgängen,<br />

keine Störschallvermeidung (Störschall entsteht beim örtlichen Ein- <strong>und</strong> Ausblenden eines Quellterms<br />

im CAA-Rechengebiet, dadurch entscheidende Beeinflussung der Güte der Simulationsergebnisse).<br />

Deshalb musste das SNGR-Modell modifiziert werden. Danach wird der Schall nicht mehr direkt durch<br />

den Quellterm erzeugt, sondern indirekt durch Wechselwirkung der Turbulenz, die der Quellterm in<br />

den EULER-Gleichungen generiert, mit der Tragflügelhinterkante.<br />

Zu den Details: Der lineare Quellterm („Shear-Term“) erzeugt bei etwa 100 Moden für die synthetische<br />

Turbulenz deutlich mehr (indirekten) Schall als die nichtlineare Quelle („Self-Term“); außerdem ist die<br />

Störschallvermeidung mittels einer Gewichtsfunktion <strong>und</strong> die Vermeidung von Instabilitätswellen, die<br />

später Quellen für Störschall am Ausströmrand sind, mit dem linearen Term besser möglich. Das modifizierte<br />

von-Kármán Spektrum ist zur Generierung der synthetischen Turbulenz geeignet. Durch die<br />

Verwendung zusätzlicher Quellgebiete, beispielsweise eines zweiten Gebietes unter der Hinterkante,<br />

wurde gezeigt, dass sich bei dünner Kante Hinterkantenlärm vermeiden lässt, wenn die Turbulenz auf<br />

beiden Seiten des Objektes spiegelsymmetrisch zueinander ist (künstlich herbeigeführter Fall).<br />

Das modifizierte SNGR-Verfahren ist nunmehr prinzipiell geeignet, den Hinterkantenlärm vorauszuberechnen,<br />

siehe dazu z. B. die erfolgreiche Validierung bzw. Verifizierung von berechneten Richtcharakteristiken<br />

der Schallabstrahlung. Für eine exakte Vorhersage der Absolutwerte der abgestrahlten<br />

Schalldruckpegel sind allerdings noch weiterführende Untersuchungen zum SNGR-Modell notwendig.<br />

Das Quellmodell mit stochastischen Geschwindigkeitsschwankungen (SNGR-Modell) wurde als zusätzliches<br />

Modul in den CAA-Code PIANO [Delfs, Grogger, Lauke et al.] des DLR raunschweig implementiert.<br />

Eine wichtige Gr<strong>und</strong>lage dieses Codes ist das hochgenaue Finite-Differenzen Schema von<br />

Tam <strong>und</strong> Webb.<br />

Schallquellenmodellierung: Oberflächendruckfelder (analytisches Verfahren)<br />

Es wurde ein analytisches Berechnungsverfahren für die Ermittlung des Zusammenhanges zwischen<br />

den Wanddruckschwankungen in der Nähe der Hinterkante <strong>und</strong> dem Fernschallfeld entwickelt. Der<br />

Vorteil eines solchen Verfahrens besteht darin, dass damit sehr verschiedenartig gewonnene Daten<br />

über die Wanddruckfelder als Schallquellenmodell verwendet werden können, <strong>und</strong> zwar empirische/halbempirische<br />

Modelle für die Wanddruckfelder (CORCOS, FFOWCS WILLIAMS,<br />

SMOL’YAKOV-TKACHENKO, CHASE u. a.), Wanddruckfelder aus numerischen Simulationen (z. B.<br />

aus LES, SNGR/LEE) <strong>und</strong> gemessene Wanddruckfelder (Messergebnisse zu den turbulenten Druckschwankungen<br />

bei überströmten Oberflächen, Umströmungskörpern <strong>und</strong> Abreißgebieten).<br />

Für bestimmte Strömungsfälle wurden die Fernfeld-Schalldruckspektren für verschiedene Wanddruckmodelle<br />

berechnet. Dabei zeigen alle Modelle sehr ähnliche Ergebnisse: der Hinterkantenlärm<br />

wird durch die konvektiven Wanddruckkomponenten beherrscht, die erfahrungsgemäß durch alle Modelle<br />

gleich gut beschrieben werden. Die Validierung dieses Rechenverfahrens steht noch aus.<br />

Validierung/Messungen<br />

Es ist von prinzipieller Bedeutung, die Validierung numerischer Simulationen <strong>und</strong> analytischer Rechenverfahren<br />

weiterzuentwickeln. Diese Erkenntnis resultiert aus der Beobachtung, dass gegenwärtig<br />

<strong>und</strong> in den letzten Jahren bei der Entwicklung numerischer Verfahren durch den rasanten Fortschritt<br />

in der Computertechnik eine extrem hohe Fortschrittsrate festzustellen ist, im Gegensatz dazu<br />

aber die für wissenschaftliche Arbeitsweise notwendige messtechnische Validierung weitestgehend<br />

nur kümmerlich behandelt wird. Deshalb muss einerseits insbesondere der Entwicklung bzw. Weiterentwicklung<br />

aerodynamischer, aeroakustischer <strong>und</strong> akustischer Messverfahren erhöhte Aufmerksamkeit<br />

geschenkt werden, andererseits aber auch dem methodischen Problem, Validierungsexperimente<br />

zu entwickeln, die auf die numerischen <strong>und</strong> analytischen Berechnungsfälle zugeschnitten sind.<br />

Während der Projektbearbeitung wurde der aeroakustische Windkanal des Instituts für die geplanten<br />

Validierungsmessungen optimiert (Einbau eines leistungsfähigeren Antriebs zum Erreichen höherer<br />

16


Forschung<br />

Strömungsgeschwindigkeiten, verbesserte Schallschutzmassnahmen zur weiteren Unterdrückung des<br />

Störgeräusches in der Messkammer).<br />

Die Validierungsmethoden für den Vergleich zwischen den numerischen/analytischen Rechenergebnissen<br />

<strong>und</strong> den Messergebnissen wurden systematisiert; neue Messmethoden wurden angewendet<br />

(Messung der Richtcharakteristik von Hinterkantenlärm am physikalischen Modell des Tragflügels im<br />

schalltoten Raum) sowie bestehende Messmethoden weiterentwickelt <strong>und</strong> verbessert (Mikrofonarray:<br />

Anwendung der Frequenzbandmittelung).<br />

Zu den Details: Mit der entwickelten <strong>und</strong> erprobten Messtechnik konnten sowohl Strömungs- als auch<br />

Schalldaten an verschieden Mess- <strong>und</strong> Rechenmodellen validiert werden. Am Beispiel von ebener<br />

Platte <strong>und</strong> NACA0012-Profil wurden erfolgreich RANS-Rechnungen mit Ergebnissen von Hitzdrahtmessungen<br />

verglichen. Die Hinterkante des NACA 0012 – Profils wurde mit dem entwickelten Mikrofonarray<br />

eindeutig als aeroakustische Hauptschallquelle identifiziert <strong>und</strong> ihre Schallabstrahlung quantitativ<br />

bestimmt. Die numerisch <strong>und</strong> analytisch berechnete Richtcharakteristik der Schallabstrahlung am<br />

Profil NACA0012 bzw. am Plattenmodell konnte sowohl durch Schalldruckmessungen im aeroakustischen<br />

Windkanal als auch durch Messungen am physikalischen Modell im schallreflexionsarmen<br />

Raum validiert werden.<br />

Durch detaillierte Untersuchungen von Beamforming-Algorithmen <strong>und</strong> Mikrofonarray-geometrien<br />

konnten über den allgemeinen Wissensstand hinausgehende Erkenntnisse über den Aufbau, die Optimierung<br />

<strong>und</strong> die praktische Anwendung von Mikrofonarrays gewonnen werden. Ein wichtiges Ergebnis<br />

sind die Ergebnisse hinsichtlich der Anwendung von neuen <strong>und</strong> weiterentwickelten Algorithmen bei<br />

Berücksichtigung der Messung von Absolutwerten. Zur Unterdrückung von störenden Nebenkeulen<br />

wird in Frequenzbändern gemittelt. Durch Untersuchung <strong>und</strong> Optimierung verschiedener Mikrofonanordnungen<br />

wurde eine angepasste Arraygeometrie, bestehend aus zwei Kreisringen, entwickelt.<br />

3.1.3 Akustische Simulationsverfahren (AKUSIM)<br />

(P. Költzsch, M. Bauer, A. Zeibig)<br />

AKUSIM (Akustische Simulationsverfahren) ist ein Teilprojekt des BMBF-Verb<strong>und</strong>projektes "Leiser<br />

Verkehr". Ziel dieses Vorhabens ist die Schaffung <strong>und</strong> Bereitstellung von Berechnungswerkzeugen für<br />

den akustisch optimalen Entwurf von typischen Fahrzeugstrukturen.<br />

Strömungsschall<br />

Im Rahmen des AKUSIM - Arbeitspaketes "Strömungsgeräusch – Wanddruckschwankungen" beschäftigt<br />

sich das <strong>IAS</strong> speziell mit dem Umströmungsgeräusch starrer Bauteile, welches beim Hochgeschwindigkeitsverkehr<br />

(PKW, Bahn, Flugzeug) eine erhebliche Belastung der Bevölkerung <strong>und</strong> der<br />

Reisenden darstellt. Dazu werden am <strong>IAS</strong> sowohl numerische Berechnungen als auch Messungen<br />

(zur Validierung der berechneten Ergebnisse) durchgeführt.<br />

Eine computergestützte akustische Optimierung von Bauteilen im Hinblick auf das von ihnen verursachte<br />

Umströmungsgeräusch ist durch eine direkte numerische Lösung der entsprechenden Gr<strong>und</strong>gleichungen<br />

(Navier-Stokes-Gleichungen, NSG) mit den heute verfügbaren Rechnerressourcen nicht<br />

möglich. Am <strong>IAS</strong> wird deshalb ein hybrides Verfahren verwendet, welches zwei vereinfachte Formen<br />

der NSG kombiniert. Im ersten Schritt werden die sog. RANS-Gleichungen (Reynolds Averaged Navier<br />

Stokes, zeitgemittelte NSG) mit dem CFD (Computational Fluid Dynamics) Code FLOWer des<br />

DLR (Deutsches Zentrum für Luft- <strong>und</strong> Raumfahrt) berechnet <strong>und</strong> die zeitabhängige Turbulenz als<br />

Schallquelle wird mittels statistischer Information aus der RANS- Lösung synthetisch erzeugt [1]. Im<br />

zweiten Schritt werden durch den CAA (Computational Aero-Acoustics) Code PIANO des DLR modifizierte<br />

Formen der Eulergleichungen (NSG ohne Reibung) gelöst, die von einem Quellterm angeregt<br />

werden. Dieser wird im Quellgebiet aus der synthetischen Turbulenz berechnet.<br />

17


Forschung<br />

Abbildung 3 Rechenergebnisse für eine Stufe mit rs = h/2 bei einer Anströmgeschwindigkeit von 50<br />

m/s: zeitgemittelte Strömung aus FLOWer (links) <strong>und</strong> Momentaufnahme des LEE-<br />

Schwankungsdruckes aus einer PIANO Testrechnung (rechts).<br />

Ziel der numerischen Untersuchungen am <strong>IAS</strong> ist die Vorausberechnung des Umströmungsgeräusches<br />

einer vorwärtsgeneigten Stufe als typisches Bauteil von Verkehrsmitteln (Beispiel: Fensterdichtungen).<br />

Dabei werden die Anströmgeschwindigkeit <strong>und</strong> die Stufenform variiert <strong>und</strong> zwei Modifikationen<br />

der Eulergleichungen, nämlich die Linearisierten Eulergleichungen (LEE) einerseits, sowie die<br />

Acoustic Perturbation Equations (APE) [2] andererseits, getestet.<br />

Abbildung 3 zeigt im linken Bild einen Ausschnitt der berechneten zeitgemittelten Strömung um eine<br />

Stufe mit der Höhe h = 12 mm <strong>und</strong> einem Krümmungsradius rs = h/2 bei einer Anströmgeschwindigkeit<br />

von 50 m/s (Ma = 0,147). Es sind Isoflächen der lokalen Machzahl Ma <strong>und</strong> ausgewählte Stromlinien<br />

dargestellt.<br />

Im rechten Bild ist eine Momentaufnahme des Schwankungsdruckes einer anschließenden instationären<br />

LEE-Testrechnung für diesen Fall zu sehen. Bei Verwendung der LEE befindet sich das Quellgebiet<br />

stromauf der Stufe <strong>und</strong> soll dort (möglichst leise) turbulente Fluktuationen anregen. Weil die zeitgemittelte<br />

Strömung in den Koeffizienten der LEE enthalten ist, folgen diese dann den Stromlinien, um<br />

schließlich an der Stufe den gesuchten Lärm zu erzeugen. Man erkennt sowohl die kleinskaligen turbulenten<br />

Fluktuationen im Bereich des Quellgebietes, als auch die Schallwellen.<br />

Zur Validierung der numerischen Untersuchungen werden am aeroakustischen Windkanal des Institutes<br />

Messungen an ausgewählten Teststrukturen durchgeführt <strong>und</strong> mit den Rechenergebnissen der<br />

Projektpartner verglichen. Zur Validierung aeroakustischer Simulationen ist insbesondere bei der Berechnung<br />

mit hybriden Methoden notwendig, sowohl Strömungs- als auch Schallfeldgrößen zu vergleichen.<br />

CSD in dB<br />

5<br />

0<br />

-5<br />

-10<br />

-15<br />

-20<br />

-25<br />

-30<br />

ohne Tripping<br />

mit Tripping<br />

-35<br />

50 100 200<br />

Frequenz in Hz<br />

500 1000<br />

Abbildung 4 Skizze der Fahrzeugmodellstruktur mit eingebauten Druckaufnehmern (K2-K4) ohne<br />

Endkappen (links) <strong>und</strong> Kreuzspektrum des Fernfeldschalldrucks <strong>und</strong> des von Druckaufnehmer 3 aufgezeichnete<br />

Wanddrucksignals (rechts, Modell jeweils ohne <strong>und</strong> mit Tripping, Anströmgeschwindigkeit<br />

vAnström = 34 m/s, p0 = 20 µPa)<br />

18


Forschung<br />

Als Teststruktur für die Messungen im Windkanal wurde eine generische Fahrzeugstruktur vom Typ<br />

„Strebe“ gewählt. Diese Fahrzeugstruktur besteht aus einem Halbzylinder mit angesetztem Heckdreikant<br />

variabler Länge <strong>und</strong> steht repräsentativ für eine ganze Reihe von aerodynamischen Schallquellen<br />

an Fahrzeugen, so. z.B. für Stromabnehmer (Bahn) <strong>und</strong> Fahrwerkskomponenten.<br />

An dieser Strebe wurden für verschiedene Heckdreikantlängen Messungen der hydro-dynamischen<br />

Wanddruckschwankungen, Hitzdrahtmessungen zur Bestimmung des Geschwindigkeitsfeldes in der<br />

Grenzschicht <strong>und</strong> im Nachlauf der umströmten Struktur sowie Schalldruckmessungen an ausgewählten<br />

Punkten im akustischen Fernfeld durchgeführt.<br />

Die Messungen der von Strömungs- <strong>und</strong> Schallfeldgrößen wurde zumindest teilweise simultan durchgeführt<br />

Damit war eine Untersuchung der Korrelation zwischen Strömungs- <strong>und</strong> Schallfeld [3] möglich,<br />

welche Rückschlüsse auf die Ursachen der Schallentstehung zuließ.<br />

Ein Bild der aufgebauten Teststruktur <strong>und</strong> das Ergebnis einer Kreuzkorrelation zwischen einem<br />

Wanddruckaufnehmer (K3) <strong>und</strong> einem Fernfeldmikrofon sind in Abbildung 4 dargestellt. Bei einigen<br />

messtechnischen Untersuchungen war zur gezielten Erzeugung der turbulenten Überströmung der<br />

Modellstruktur ein Trippstreifen an der Abrisskante des Modells (Übergang Halbzylinder – Heckdreikant)<br />

angebracht.<br />

In den bisher durchgeführten Untersuchungen war es möglich, zusätzlich zu der erwarteten Ausbildung<br />

einer Karman’schen Wirbelstraße („Querresonanz“) eine weitere hydrodynamische Instabilität<br />

(„Längsresonanz“) zu finden, welche unter bestimmten Bedingungen auch zur Schallabstrahlung führen<br />

kann [4]. Beschreibungen dieser Schwingungsform aus der Literatur sind bisher nicht bekannt,<br />

allerdings wurde in den numerischen Untersuchungen des Projektpartners DLR bei bestimmten Heckdreikantlängen<br />

eine ähnliche Schwingungsform entdeckt.<br />

[1] R. H. Kraichnan: Diffusion by a Random Velocity Field. The Physics of Fluids, Vol. 13, No. 1, pp.<br />

22-31, 1970<br />

[2] R. Ewert et. al.: Computation of Trailing Edge Noise via LES and Acoustic Perturbation Equations.<br />

AIAA-Paper 2002-2467, American Institute for Aeronautics and Astronautics, 2002.<br />

[3] Mueller, T. J. (Ed.).: Aeroacoustic Measurements. 1. Auflage. Berlin/Heidelberg. Springer-Verlag ,<br />

2002<br />

[4] Achilles, S.: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellstrukturen. <strong>Diplom</strong>arbeit,<br />

TU <strong>Dresden</strong>, Institut für Akustik <strong>und</strong> Sprachkommunikation, 2004<br />

(Dipl.-Ing. A. Zeibig, Dipl.-Ing. M. Bauer)<br />

Körperschall-Energieflussmethode<br />

Bei der Konstruktion von Fahrzeugen besteht eine wesentliche Aufgabe in der Berechnung der<br />

Schallabstrahlung <strong>und</strong> der Fahrzeugschwingungen. Die Statistische Energieanalyse (SEA), eine Berechnungsmethode<br />

für mittlere <strong>und</strong> hohe Frequenzen, weist bei ihren Vorhersagen oft einige Einschränkungen<br />

auf, die vor allem aus ihrem statistischen Charakter resultieren. Aus diesem Hintergr<strong>und</strong><br />

heraus werden nicht nur Erweiterungsmöglichkeiten zur SEA betrachtet, sondern es gibt verschiedene<br />

Bestrebungen, alternative Berechnungs-verfahren zu untersuchen. Eine der alternativen<br />

Theorien ist in eine Bo<strong>und</strong>ary Element Method integriert <strong>und</strong> basiert auf der lokalen Energieerhaltung<br />

in einem System.<br />

Diese Methode, die High Frequency Bo<strong>und</strong>ary Element Method (HFBEM), ist in einem Computerprogramm<br />

umgesetzt worden, dass die Schwingungsberechnung von punktförmig angeregten ebenen<br />

Strukturen, die aus beliebig vielen Einzelstrukturen bestehen, gestattet.<br />

Um dieses Verfahren nicht nur mit der SEA hinsichtlich ihres Konvergenzverhaltens zu vergleichen,<br />

sondern auch mit Messwerten von realen Strukturen, erfolgte bereits im letzten Jahr die Definition von<br />

drei fahrzeugtypischen Anwendungsfällen <strong>und</strong> die Konstruktion dieser in Form von drei generischen<br />

Fahrzeugstrukturen. Die Abbildungen 5 - 7 zeigen ein PKW-Bodenblech, den Hochflurbereich eines<br />

Regionalzuges in einem vereinfachten Aufbau, sowie eine verrippte Aluminiumplatte.<br />

19


Forschung<br />

Abbildung 5 PKW-Bodenblech Abbildung 6 Verripte Platte<br />

Abbildung 7<br />

Hochflurbereich eines Regionalzuges<br />

Berechnungen <strong>und</strong> Messungen:<br />

An allen 3 Strukturen erfolgten bereits Messungen des Schallübertragungsverhaltens, wobei hier stellvertretend<br />

einige Ergebnisse der verrippten Platte vorgestellt werden. In Abbildung 8 ist diese mit<br />

Längs- <strong>und</strong> Querversteifungen dargestellt, wobei die definierten Messpfade (L1,L2, Q0,Q1,Q2,Q3)<br />

eingezeichnet sind.<br />

20<br />

Abbildung 8 Messanordnung<br />

der verrippten Platte<br />

Während des Projektes liegt ein Schwerpunkt auf der Vorhersage<br />

von fahrzeugspezifischen Änderungen, d.h. inwieweit die<br />

HFBEM das Schwingungsverhalten der Strukturen vorhersagen<br />

kann, wenn an diesen praxisrelevante Änderungen<br />

durchgeführt wurden. Für die verrippte Platte fanden Messungen<br />

mit den Längs- <strong>und</strong> Querversteifungen, mit Längs- oder<br />

Querversteifungen, sowie ohne Versteifungen statt. Dabei<br />

wurde die Position der Messpfade beibehalten. Die Quelle bestand<br />

in Form eines elektromechanischen Schwingerregers,<br />

der die Platte zu Biegeschwingungen anregt.<br />

In den Abbildungen 9 <strong>und</strong> 10 sind die Ergebnisse der Frequency<br />

Response Function FRF = 10 log (v²/P) dB für den<br />

Messpfad Q2 bei 8 kHz der unversteiften Platte (Abbildung 9),<br />

sowie der längsversteiften Platte (Abbildung 10) dargestellt. In<br />

beiden Fällen wurde deutlich, dass die HFBEM erst bei hohen<br />

Dämpfungen (1% bei 8 kHz) den erwarteten Pegelabfall quantitativ<br />

widerspiegelt.


Forschung<br />

Bei geringeren Frequenzen ist die Materialdämpfung teilweise wesentlich kleiner als 1 %, wodurch die<br />

HFBEM ähnlich „glatte“ Verläufe wie die SEA prognostiziert. Im Falle der versteiften Platte (Abbildung<br />

10) berechnet die HFBEM einen der Messung vergleichbaren Pegelverlauf, der durch die zusätzliche<br />

– <strong>und</strong> in der Rechnung noch nicht berücksichtigte – Dämpfung durch die Versteifungen geringfügig<br />

über den Messwerten liegt.<br />

FRF 10 log (v² / P )dB<br />

0<br />

-10<br />

-20<br />

-30<br />

-40<br />

Messung HFBEM<br />

SEA<br />

-50<br />

0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80<br />

Abbildung 9 unversteifte Platte, f = 8kHz<br />

FRF 10 lg (v² / P) dB<br />

0<br />

-10<br />

-20<br />

-30<br />

-40<br />

Messung SEA<br />

HFBEM<br />

-50<br />

0.00 0.10 0.20 0.30 0.40 x 0.50 / m 0.60 0.70 0.80<br />

Abbildung 10: längsversteifte Platte, f = 8kHz<br />

Zur Zeit erfolgen weitere Berechnungen <strong>und</strong> Messungen an den Fahrzeugstrukturen, wobei bei der<br />

HFBEM-Berechnung insbesondere der Zusammenhang zwischen Plattendämpfung <strong>und</strong> Randdämpfung<br />

untersucht wird.<br />

(Dipl.-Ing. B. Knöfel)<br />

3.1.4 Messung akustischer Charakteristiken von Modellstrukturen als<br />

Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln<br />

(gefördert durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-Stiftung)<br />

Der durch Strömungen verursachte Lärm stellt eine erhebliche Belastung der Bevölkerung <strong>und</strong> der<br />

Reisenden beim Hochgeschwindigkeitsverkehr dar. Während die Strategie bisheriger Lärmminderungsverfahren<br />

weitestgehend auf eine nachträgliche Lärmsanierung am konkreten technischen Gegenstand<br />

ausgerichtet war, ist das Ziel zukünftiger Vorgehensweisen beim Lärmschutz, durch die<br />

akustische Auslegung des Verkehrsmittels ein bereits leises Verkehrsmittel entstehen zu lassen. Dies<br />

bedeutet, dass die Lärmproblematik vollständig in den Entwurf <strong>und</strong> in die Konstruktion des Verkehrsmittels<br />

integriert wird. Diese Strategie der Lärmminderung erfordert akustische Modellierungs- <strong>und</strong><br />

Simulationsverfahren, die die akustische Optimierung des virtuellen, noch nicht gegenständlich vorhandenen<br />

Verkehrs-mittels ermöglichen.<br />

Für die Realisierung dieser Vorgehensweise der Lärmbekämpfung müssen neben der Entwicklung<br />

aeroakustische Berechnungs- <strong>und</strong> Bewertungsverfahren insbesondere auch experimentelle aeroakustische<br />

Untersuchungen an Modellen von Fahrzeugstrukturen durchgeführt werden, im Spezialfall<br />

sind auch reine akustische Messungen (also ohne Strömung) an einfachen Bauteilen erforderlich.<br />

Diese Messaufgabe wurde mit finanzieller Unterstützung durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-<br />

Stiftung bearbeitet.<br />

Experimenteller Teil:<br />

• Als elektroakustische Punktschallquellen vom Typ Monopol, Dipol <strong>und</strong> Quadrupol wurden jeweils<br />

mehrere Lautsprecheranordnungen zur Realisierung eines Elementarstrahlertyps erprobt. Die akustischen<br />

Richtcharakteristiken dieser Schallquellen wurden im Großen Schallreflexionsarmen<br />

Raum, in Abhängigkeit von der Frequenz <strong>und</strong> dem Abstrahlwinkel, vermessen. Diese Punktschallquellen<br />

dienen als Modellquellen für die physikalischen Mechanismen der Strömungsschallerzeugung<br />

bei umströmten Strukturen.<br />

• Die Punktschallquellen wurden in unmittelbarer Nähe von typischen Modellstrukturen der Verkehrsmittel<br />

angebracht. Dabei wurden folgende Strukturen untersucht:<br />

- Dipol-Punktschallquelle hinter einer Platte:<br />

als Modell für den umströmten Tragflügel eines Flugzeuges <strong>und</strong> die Schallerzeugung an der<br />

Hinterkante,<br />

- Dipol-Punktschallquelle in der Ecke einer L-förmigen Platte:<br />

21


Forschung<br />

als Modell für die Schallerzeugung an der Klappenseitenkante eines Tragflügels mit ausgefahrener<br />

Landeklappe,<br />

- Dipol-Punktschallquelle im Schlitz zwischen zwei unterschiedlich breiten Platten:<br />

als Modell für die Schallerzeugung im Schlitz zwischen der ausgefahrenen Landeklappe <strong>und</strong><br />

dem Tragflügel bzw. im Schlitz zwischen dem Vorflügel <strong>und</strong> dem Tragflügel.<br />

In den beiden erstgenannten Fällen wurden die Abstände der Schallquelle zur Plattenhinterkante bzw.<br />

die Anordnungen der Schallquelle an der Klappenseitenkante variiert.<br />

• Die Messergebnisse zeigen den frequenzabhängigen Einfluss der Abmessungen der Bauteilstruktur<br />

(Tragflügel-Sehnenlänge) auf die gerichtete Schallabstrahlung der Hinterkantenströmungsschallquelle<br />

bzw. der entsprechenden Modellschallquelle an der Klappenseitenkante bzw. im<br />

Schlitz zwischen Tragflügel <strong>und</strong> ausgefahrener Landeklappe.<br />

Theoretisch-rechnerischer Teil:<br />

Zum Vergleich der Messergebnisse aus dem schallreflexionsarmen Raum mit Rechenergebnissen<br />

wurden im Rahmen dieses Projektes folgende Untersuchungen durchgeführt:<br />

• Die Richtcharakteristik der Schallabstrahlung des Hinterkantenlärms wurde mit dem hybriden numerischen<br />

Verfahren SNGR+CAA (Stochastic Noise Generation and Radiation + Computational<br />

Aeroacoustics) berechnet. Dieses Verfahren wurde im Rahmen eines DFG-Verb<strong>und</strong>projektes von<br />

der TU <strong>Dresden</strong> gemeinsam mit dem DLR Braunschweig entwickelt. Für den Vergleich mit den<br />

Messergebnissen aus dem schallreflexionsarmen Raum wurde der Richtungsfaktor der Schallabstrahlung<br />

frequenzabhängig auf einem Kreis um die Hinterkante an den Positionen von 120 virtuellen<br />

Mikrofonen berechnet. Dabei wurden die beiden Fälle der MACH-Zahl Ma = 0 <strong>und</strong> Ma = 0,11<br />

betrachtet: der erstgenannte Fall zum direkten Vergleich mit den reinen akustischen Messungen<br />

im schallreflexionsarmen Raum, siehe Abbildung 11 (Messungen erfolgte ohne Strömung), der<br />

letztgenannte Fall zur Beurteilung des Einflusses der MACH-Zahl (der bei niedrigen MACH-Zahlen<br />

gering ist).<br />

• Des Weiteren wurden die frequenzabhängigen Richtcharakteristiken der Schallabstrahlung des<br />

Hinterkantenlärms mit analytischen Rechenverfahren aufgearbeitet. Dabei ergaben sich aus den<br />

Theorien von FFOWCS WILLIAMS <strong>und</strong> HALL, von TAM <strong>und</strong> YU sowie von HOWE interessante<br />

Einblicke in den physikalischen Wirkungsmechanismus der Schallerzeugung an der Hinterkante.<br />

Mit der exzellenten, aber sehr komplizierten Theorie von HOWE konnte mit dem Computer der<br />

gesamte Frequenzbereich der Schallabstrahlung erfasst werden, <strong>und</strong> zwar von HELMHOLTZ-<br />

Zahlen kL > 1 (k Wellenzahl, L Sehnelänge des Tragflügels). Der Übergang von<br />

der Dipol-Richtcharakteristik (kompakte Quelle, kL


210<br />

120<br />

(SNGR+CAA)<br />

Forschung<br />

p/pmax<br />

90 90<br />

1<br />

60 Rechnung<br />

120<br />

0.8<br />

Messung<br />

06<br />

0.4<br />

0.2<br />

180 0<br />

150<br />

240<br />

270<br />

kL = 3 kL = 5<br />

90<br />

270<br />

Abbildung 11<br />

Richtcharakteristik des Hinterkantenlärms<br />

kL = 10 Vergleich: Messung/Rechnung<br />

G'<br />

Abbildung 12 Richtcharakteristik ( kL,<br />

Θ)<br />

des Hinterkantenlärms, berechnet mit der Theorie<br />

G'<br />

von HOWE<br />

300<br />

120 60<br />

30<br />

θ<br />

330<br />

180 0<br />

210<br />

240<br />

300<br />

30<br />

θ<br />

330<br />

Rechnung<br />

Messung<br />

max<br />

180<br />

150<br />

210<br />

240<br />

270<br />

60<br />

300<br />

30<br />

Rechnung<br />

Messung<br />

θ<br />

330<br />

0<br />

23


Forschung<br />

Die Arbeiten am Forschungsprojekt „Messung akustischer Charakteristiken von Modellstrukturen als<br />

Beitrag zur lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln“ dienten als akustische Vor<br />

felduntersuchungen für die Entwicklung leiser Fahrzeugstrukturen beim Hochgeschwindigkeitsverkehr.<br />

Die Messungen im schallreflexionsarmen<br />

Raum <strong>und</strong> die dabei realisierte elektroakustische Modellie-<br />

rung der Strömungsschallquellen stellen eine neue aeroakustische Messmethode dar, die in dieser<br />

Form <strong>und</strong> mit diesen Ergebnissen bisher in der Fachliteratur nicht gef<strong>und</strong>en werden konnte. Der Vergleich<br />

zwischen den Messergebnissen <strong>und</strong> den Rechenergebnissen (numerische <strong>und</strong> analytische<br />

Verfahren) trug ganz wesentlich zum physikalischen Verständnis der Schallerzeugung <strong>und</strong> Schallabstrahlung<br />

von umströmten Strukturen bei.<br />

(P. Költzsch, A. Witing, M. W. Kettlitz)<br />

3.1.5 Integrierte Sensornetzwerke, Teilprojekt im SFB 639<br />

Seit Januar 2004 wird im Rahmen des DFG-Sonderforschunmgsbereiches<br />

„Textilverstärkte Verb<strong>und</strong>komponenten<br />

für funktionsintegrierende Mischbauweisen bei komplexen Leichtbau-anwendungen“<br />

SFB 639 das Teilprojekt „Integrierte Sensornetzwerke“ bearbeitet. Gemeinsam mit dem Fraunhofer<br />

Institut<br />

für Photonische Mikrosysteme werden Sensornetzwerke entworfen, die vollständig in textilverstärkte<br />

Bauteile aus Glasfaser-Polypropylen-Verb<strong>und</strong>en integrierbar sind. Derartige Bauteile werden<br />

aus mehreren textilen Lagen von Geweben oder Gestricken durch Verpressen bei Schmelztemperatur<br />

der Thermoplastkomponente gefertigt.<br />

Das Ziel der Anwendung von bauteilintegrierten Sensornetzwerken ist einerseits, die Erkennung von<br />

Ereignissen, welche plötzlich <strong>und</strong> zeitlich unbestimmt eintreten können <strong>und</strong> andererseits, die permanente<br />

Funktionsüberwachung von sicherheitsrelevanten Bauteilen. Plötzlich eintretende Ereignisse<br />

können z. B. bei Crashsituationen an Fahrzeugfrontmodulen oder durch Schlageinwirkungen an<br />

Schutzhelmen hervorgerufen werden.<br />

Das Systemkonzept umfasst auch den Entwurf von elektronischen Komponenten, wie Controller-,<br />

Sensor- <strong>und</strong> Transponderchips am Fraunhofer Institut für Photonische Mikrosysteme.<br />

Wesentliche Untersuchungen konzentrieren sich auf Systeme, die eine drahtlose Energie- <strong>und</strong> Datenübertragung<br />

voraussetzen. Derartige Systeme sind beispielsweise erforderlich, wenn in der Einsatzumgebung<br />

ein erhöhtes Explosionspotenzial besteht, das zu überwachende Bauteil vor Manipulationen<br />

geschützt werden soll oder eine Leitungsminimierung angestrebt wird (Fahrzeugbau). Für den<br />

Einsatz solcher Sensornetzwerke stehen im Fall des autonomen Betriebs nur sehr begrenzte Energieressourcen<br />

zur Verfügung. Insbesondere für den Fall, dass schnell ablaufende Vorgänge mit großer<br />

zeitlicher Auflösung erfasst werden sollen, ergeben sich außerordentlich hohe Anforderungen bezüglich<br />

des Energieverbrauches. Aufgr<strong>und</strong> der Energieknappheit bei der ebenfalls in den textilen Werkstoff<br />

integrierten Stromversorgung besteht das Interesse, eine Datenerfassung ereignisgesteuert auszulösen.<br />

Für den Fall, dass kein Gr<strong>und</strong> besteht, eine Datenaufzeichnung bzw. Auswertung vorzunehmen<br />

(Ruhezustand), sollen nur die benötigten Komponenten des Systems mit Energie versorgt werden.<br />

Im günstigsten Fall ist das System völlig ausgeschaltet. Zum schnellen Aktivieren der Elektronik<br />

aus dem stromfreien Standby-Betrieb im Moment eines kritischen Ereignisses soll ein Sensor entworfen<br />

werden, der bei Überschreiten eines bestimmten Schwellwertes der Beschleunigung so viel Energie<br />

erzeugt, dass ein Einschalten der Elektronik möglich ist. Hierfür ist die Konzeption eines piezoelektrischen<br />

Beschleunigungssensors vorgesehen. Der Entwurf des speziellen Wandlers muss sich<br />

durch hohe Temperaturbeständigkeit (Konsolidierungstemperatur während der Integration beträgt<br />

220 °C), sehr flache Bauform (geringe Festigkeitsminderung des Bauteils), robuste Ausführung (Verpressen<br />

der Glasfaser-Thermoplastmatten bei 5 bis 10 bar) <strong>und</strong> konstruktiv einstellbare Triggerbeschleunigungs-werte<br />

auszeichnen.<br />

Durch die Konsolidierungsbedingungen werden hohe Anforderungen an die Fertigungstechnologien<br />

zur zerstörungsfreien Integration von elektronischen Baugruppen, Aktoren <strong>und</strong> Sensoren gestellt. In<br />

Abbildung 13 sind die zu integrierenden<br />

Baugruppen dargestellt. Nach gelungener Integration der<br />

Systemkomponenten ist deren Resistenz gegenüber Stoßbeschleunigungen zu prüfen <strong>und</strong> die Reduktion<br />

der Bauteilfestigkeit durch die integrierte Messtechnik zu analysieren.<br />

Erste Ergebnisse zum Thema „Aufwecksensor“ wurden durch Integration von Piezokeramik-Metall-<br />

Biegeplatten in den Verb<strong>und</strong>werkstoff erzielt. Die zur Triggerung der Elektronik notwendige Energie<br />

kann je nach Beschleunigungsschwellwert durch ca. 0,5 mm dicke Sensoren mit (10...20) mm Durchmesser<br />

erzeugt werden. Die kommerziell verfügbaren Piezoelemente erfüllen<br />

allerdings nicht die<br />

Dauerfestigkeitsforderungen bei hohen Stoßbeschleunigungen. Daher laufen gegenwärtig Arbeiten<br />

zum individuellen Aufwecksensorentwurf, auch hinsichtlich der Geometrieminimierung. Durch Messungen<br />

mit mehreren, in orthogonal verstärkten Plattenstrukturen, integrierten Aufwecksensoren wur-<br />

24


Forschung<br />

den die Wellenausbreitungsgeschwindigkeiten mit (500...1000)m/s ermittelt. Daraus leitet sich die<br />

Notwendigkeit eines verteilten Sensornetzwerkes, mit Sensorabständen im Bereich von 10 cm ab,<br />

wenn reale Stöße innerhalb weniger 100 µs aufgezeichnet werden sollen. Zur Beschleunigungsmessung<br />

in Plattenstrukturen wurden erste integrierfähige Sensoren entworfen, deren Beschleunigungs-<br />

Zeit-Funktion gut mit den Messungen von extern befestigten Beschleunigungssensoren <strong>und</strong> der mit<br />

einem Laservibrometer bestimmten Oberflächenbeschleunigungen korreliert.<br />

Abbildung 13: Technologische Aufgaben bei der Integration von Messtechnik in Bauteile aus textilen<br />

Schichten<br />

Neben<br />

der Messung von Beschleunigungen in Crashsituationen ist auch die Erfassung von Deh-<br />

nungszuständen an größeren Faserverb<strong>und</strong>strukturen, wie Fahrzeugfrontmodulen von Interesse. Um<br />

den Dehnungszustand von Verstärkungsfasern innerhalb des Werkstoffes ohne eine Festigkeitsverringerung<br />

des<br />

Bauteils bestimmen zu können wird der Einsatz von Kohlenstofffasern als Messelement<br />

untersucht.<br />

Hierbei wirken die Messelemente nicht als Störung, sondern selbst als Verstärkungsfasern.<br />

Derartige Messelemente wurden entworfen <strong>und</strong> in die Glasfaser-Polypropylen-Verb<strong>und</strong>e integriert.<br />

Die Messfehler liegen derzeit im Prozent-Bereich. Schwierigkeiten bereitet noch die gestreckte<br />

Applikation der Kohlenstoff-Rovings <strong>und</strong> deren stabile Kontaktierung.<br />

Um elektronische Bauelemente in den Verb<strong>und</strong>werkstoff zu integrieren zu können, wurde deren Temperaturfestigkeit<br />

untersucht. Dafür wurden Chips der CMOS-Technologie XC06 mit Temperaturen bis<br />

300 °C über 20 min beaufschlagt <strong>und</strong> anschließend bei Raumtemperatur auf ihre Funktion getestet.<br />

Alle Funktionen von Mikrocontroller, RAM, EEPROM <strong>und</strong> Flash konnten erfolgreich geprüft werden.<br />

(Prof. G. Pfeifer, Dipl.-Ing. J. Landgraf, Dipl.-Ing. S.<br />

Folprecht, Dipl.-Ing. E. Starke)<br />

3.1.6 Ultraschallwandler für gerichtete Audioschallabstrahlung <strong>und</strong><br />

Simulationsverfahren für spezielle Anwendungen in der<br />

Elektroakustik<br />

Die seit 1999 laufenden Arbeiten zum Industriethema „Gerichtete Audioschallwiedergabe mittels<br />

Ultraschall“<br />

wurden abgeschlossen. Die Leistungsgrenzen dieses Verfahrens, die Leistungsgrenzen<br />

verschiedener<br />

Ultraschallwandlerverfahren <strong>und</strong> die aktuell vorhandenen Möglichkeiten eines<br />

praktischen<br />

Einsatzes<br />

wurden zusammenfassend<br />

dargestellt <strong>und</strong> so eine Beurteilung der Kosten-Nutzen-Relation<br />

beim<br />

Auftraggeber ermöglicht.<br />

In einer Einsatzstudie, durchgeführt von Studenten der FH Furtwangen, Fachbereich Product Engineering,<br />

wurden weitere Möglichkeiten der Anwendung untersucht. Diese Arbeiten wurden durch einen<br />

Vortrag <strong>und</strong> Konsultationen unterstützt [4].<br />

Einen weiteren Schwerpunkt bildeten Simulationsverfahren, die besonders für Anwendungen der Elektroakustik<br />

vorteilhaft sind (Netzwerktechnik)<br />

[88]. Es wurden Verfahren untersucht. die die Parametrierung<br />

komplizierter akustischer <strong>und</strong> mechanischer Bauteile als Näherungslösung durch statische<br />

Finite-Elemente-Techniken ermöglichen.<br />

25


Forschung<br />

Darüber hinaus wurden für den industriellen Auftraggeber Finite-Elemente-Rechnungen für aktuelle<br />

Mikrofonentwicklungen vorbereitet, die eine einfache Anwendung auf der Rechentechnik des AG ermöglicht.<br />

Mit der Optimierung von Magnetsystemen in elektroakustischen Geräten mit der Finite-<br />

Elemente-Technik wurde begonnen.<br />

(Prof. Dr. G. Pfeifer)<br />

3.1.7 Mikrofon mit weitgehend frequenzunabhängiger<br />

Richtcharakteristik<br />

Zur Formung spezieller Richtcharakteristiken werden in der Elektroakustik meist<br />

mehrere elementare<br />

Schallwandler räumlich zu Zeilen, Spalten oder Arrays zusammengestellt. Ohne besondere<br />

Maßnahmen<br />

sind die zu erzielenden Richtcharakteristiken<br />

frequenzabhängig.<br />

Die<br />

Richtcharakteristiken ergiben sich dabei stets aus dem Verhältnis der geometrischen Abmessun-<br />

gen der Anordnung zur Wellenlänge.<br />

Für einige Anwendungen im Bereich der Beschallungs- oder Aufnahmetechnik stört diese Frequenzabhängigkeit.<br />

Um eine Forderung nach einer weitgehend frequenzunabhängigen<br />

Richtcharakteristik<br />

zu erfüllen, müssten sich die Abmessungen der Schallwandleranordnung frequenzabhängig ändern.<br />

Eine Lösungsmöglichkeit, die Abmessungen<br />

scheinbar frequenzab-hängig zu ändern besteht darin,<br />

den benötigten Frequenzbereich in einzelne Teilbereiche zu zerlegen, eine größere Anzahl von Wandlern<br />

einzusetzen <strong>und</strong> jedem Teilfrequenzbereich nur bestimmte Wandler zuzuordnen. Die Zuordnung<br />

der Wandler zum jeweiligen Frequenz-bereich muss dabei so erfolgen, dass die Abstände der im jeweiligen<br />

Frequenzbereich aktiven Wandler zueinander zur Wellenlänge möglichst konstant bleiben.<br />

Nach diesem Prinzip arbeitet das Kardioid- Ebenen- Mikrofon KEM 970 der MICROTECH GEFELL<br />

GMBH.<br />

Dieses Mikrofon besitzt in der Horizontalebene die Richtcharakteristik einer Superniere, in der Vertikalebene<br />

dagegen die eines Richtmikrofons mit einem Öffnungswinkel von ca. 20º. Im KEM 970 wer-<br />

den<br />

acht Mikrofonkapseln mit Supernierencharakteristik eingesetzt. Je nach Frequenzbereich werden<br />

unterschiedliche<br />

Mikrofonsignale addiert <strong>und</strong> mit einer Filterbank bewertet. Nach Addition der Signale<br />

der Filterbank ergeben sich wieder ein weitgehend linearer Frequenzgang <strong>und</strong> die gewünschte Richtcharakteristik.<br />

Die ursprüngliche Entwicklung, die zum KEM 970 führte, wurde vor ca. 10 Jahren im INSTITUT FÜR<br />

RUNDFUNKTECHNIK begonnen. Neben den für Mikrofone üblichen Mikrofonkapseln <strong>und</strong> deren Vor-<br />

26


Forschung<br />

verstärker,<br />

wird im KEM 970 eine umfangreiche analoge Schaltungstechnik zur Bearbeitung der Mik-<br />

rofonsignale notwendig.<br />

In den letzten Jahren begann auch im Bereich der Mikrofontechnik eine Entwicklung hin zur digitalen<br />

Signalverarbeitung. Die ersten Mikrofone mit integriertem digitalen Signalprozessors (DSP) sind auf<br />

dem Markt. Der DSP übernimmt<br />

dabei meist die Aufgaben den Dynamikumfang der Mikrofone durch<br />

mehrere pegelmäßig kaskadierte ADC zu erhöhen (STAGETEC TRUEMATCH) <strong>und</strong> die Realisierung<br />

des digitalen Audiointerface. Für die umfangreiche Signalverarbeitung im KEM bietet sich der Einsatz<br />

eines DSP an. Am Beispiel des KEM 970 wurden am <strong>IAS</strong> alle zur Signalverarbeitung notwendigen<br />

Algorithmen für den Signalprozessor ADSP21161N von ANALOG DEVICES erstellt <strong>und</strong> erfolgreich<br />

getestet. Es zeigte sich, dass sich alle bisherigen analogen Signalverarbeitungsstufen des KEM durch<br />

digitale Signalverarbeitung vorteilhaft ersetzen lassen. Einen deutlichen Qualitätsgewinn brachte die<br />

digitale Signalverarbeitung im Bezug auf den zu erreichenden Signal- Rauschabstand.<br />

Die Programmierung des ADSP21161N erfolgte in der Sprache ANSI-C. Dabei musste festgestellt<br />

werden, dass diese Programmiersprache den DSP nur schlecht unterstützt, so dass die programmierten<br />

Algorithmen nur bis zu einer Abtastfrequenz von 48 KHz zuverlässig funktionierten.<br />

Für höhere<br />

Abtastfrequenzen <strong>und</strong> umfangreichere Filterstrukturen ist deshalb die Programmierung zukünftig in<br />

Assemblersprache notwendig.<br />

(Dipl.-Ing. D. Richter)<br />

3.1.8 Bestimmung von Kenngrößen eines Telefonhörers<br />

Für den Hersteller von Kommunikationstechnik PRAGMA, Zittau, wurden Messungen<br />

zur Bestimmung<br />

von Kenngrößen eines Telefonhörers durchgeführt. Dabei war die Ermittlung von<br />

Übertragungsmaß<br />

<strong>und</strong><br />

Spektrum einer Hörkapsel für vorgegebene, spezielle Ansteuerbedingungen von besonderem<br />

Interesse.<br />

Die Messungen erfolgten mit Hilfe eines künstlichen Ohres nach IEC 318 (Artificial Ear Type 4153,<br />

Brüel & Kjaer).<br />

Vorab war die Gestaltung der mechanischen Ankopplung der Hörkapsel an das künstliche Ohr zu<br />

klären. Das Ziel dabei war, die Relevanz der Messergebnisse nachzuweisen <strong>und</strong> eine ausreichende<br />

Reproduzierbarkeit<br />

zu sichern. Im Ergebnis gelang es, charakteristische Daten für die Hörkapsel zu<br />

erhalten, die den Messvorgaben ausreichend gerecht wurden.<br />

(Dr. G. Fuder)<br />

27


Forschung<br />

3.2 AG „Systemtheorie <strong>und</strong> Sprachkommunikation“<br />

3.2.1 Vorbemerkung<br />

Die Arbeitsgruppe betreibt weiterhin Signal- <strong>und</strong> Systemtheorie mit besonderer Betonung der Anwendung<br />

in der Sprachtechnologie. Die Arbeiten gruppieren sich um die beiden, nun schon über eine Anzahl<br />

von Jahren gepflegten experimentellen Systeme UASR <strong>und</strong> DRESS.<br />

Das System UASR (unified approach for speech synthesis and recognition), das zur experimentellen<br />

Untersetzung des Analyse-durch-Synthese-Prinzips konzipiert wurde, dient gegenwärtig hauptsächlich<br />

als Plattform für Erkennerexperimente. Die Technologie ist inzwischen so weit ausgereift, dass neben<br />

der Abspaltung von Lösungen für die Spracherkennung (z. B. Speech-Applet für Projekte der Webbasierten<br />

Lehre) sogar erfolgreiche Anwendungen auf nichtsprachliche Signale möglich wurden (Maschinendiagnose,<br />

medizinische Diagnose, Musiksequenzen), zu denen u. a. ein DFG-Projekt in Kooperation<br />

mit dem Fraunhofer Institut für zerstörungsfreie Prüfverfahren im Berichtsjahr begonnen<br />

werden konnte.<br />

Das System DRESS (Dresdner Sprachsynthese) wird ebenfalls als Forschungssystem weitergeführt<br />

<strong>und</strong> diente im Berichtszeitraum hauptsächlich zur vertieften Untersuchung von Prosodiemodellen. Für<br />

die Finanzierung der Forschungsarbeiten bildet die praktische Anwendung von DRESS in einer Embedded-Variante<br />

die wichtigste Quelle. Diese Arbeiten wurden im Rahmen der Virtuel Research and<br />

Development Group (VRDG) mit der von Prof. Höge geleiteten Siemens-Arbeitsgruppe weitergeführt.<br />

Beide Einrichtungen waren 2004 Gründungsmitglieder des European Center of Excellence on Speech<br />

Synthesis (ECESS); vgl. www.ecess.org.<br />

Die folgende Darstellung bietet eine Übersicht vornehmlich zu den Arbeiten an den beiden genannten<br />

Komplexen. Von den recht zahlreichen kleineren Aktivitäten wird danach eine Auswahl beschrieben.<br />

3.2.2 UASR (Unified Approach for Speech Synthesis and Recognition)<br />

Das Forschungssystem UASR beschäftigt sich mit der „Integration von Spracherkennung <strong>und</strong> Sprachsynthese<br />

unter Verwendung gemeinsamer Datenbasen“. Über dieses Projekt haben wir bereits in den<br />

Jahren 2002 <strong>und</strong> 2003 berichtet. Für einen Überblick über die Ziele <strong>und</strong> die Systemarchitektur wird auf<br />

die entsprechenden Jahresberichte sowie auf [1] verwiesen. Die Anwendung <strong>und</strong> der Ausbau des<br />

Systems wurden im Rahmen von zwei DFG-Projekten fortgeführt. Im Berichtsjahr entstand eine ausführliche<br />

Dokumentation auf HTML-Basis (Abbildung 14).<br />

In diese Dokumentation wurden die Beschreibungen der Module des Systems, zugehörige Konferenzbeiträge<br />

<strong>und</strong> technische Beschreibungen, sowie anwendungsspezifische Dokumente aufgenommen.<br />

Algorithmische Weiterentwicklungen fanden vor allem bei den Methoden zur Verarbeitung von FSMs<br />

(finite state machines) statt. Auf diese Arbeiten wird im Abschnitt b) eingegangen. Weiterhin wurde die<br />

Integration von Verfahren zur Sprechernormalisierung (VTN) fortgeführt <strong>und</strong> die Ergebnisse auf der<br />

ICASSP 2004 vorgestellt [2].<br />

Im Jahresbericht 2003 hatten wir über einen Sprachdienst mit verteilter Architektur berichtet, der im<br />

Rahmen des Projektes eL-IT eingesetzt wurde. Wir haben den Spracherkenner weiterentwickelt <strong>und</strong><br />

um eine Stimmaktivierung ergänzt (Abschnitt c). Durch die Client/Server-Architektur eignet sich das<br />

System besonders zur Integration von Sprachtechnologie in bestehende Anwendungen. In einer <strong>Diplom</strong>arbeit<br />

wurde die Sprachsteuerung eines Computerspiels in Hinblick auf die ergonomischen Qualitäten<br />

untersucht ([5], siehe Abschnitt d).<br />

a) LM-Synergien<br />

Im Jahresbericht 2003 haben wir gezeigt, wie der Einsatz <strong>und</strong> die Verwendung eines Sprachmodells<br />

(LM = Language Model) zur Auswahl von Aussprachevarianten in der Sprachsynthese zu einer höheren<br />

Akzeptanz im Bereich der Natürlichkeit (54% der Testbeispiele) <strong>und</strong> Spontanspachlichkeit (64%<br />

der Testbeispiele) führt.<br />

Weitere Untersuchungen haben aber auch ergeben, dass vor allem Wortübergänge falsch modelliert<br />

werden. Bisher wurde die Aussprachevariante nur anhand der Dauer ausgewählt. Es wird kein Wissen<br />

darüber verwendet, wie gut zwei ausgewählte Varianten zueinander passen oder nicht. Auch kann<br />

28


Forschung<br />

nicht jede Variante an jeder Stelle einer Äußerung stehen: z. B. kurze Aussprachevarianten sollten<br />

nicht als erste Silbe eines Satzes stehen oder zwischen zwei wichtigen Inhaltswörtern.<br />

Abbildung 14: Startseite der Dokumentation zu UASR.<br />

Um die Natürlichkeit der synthetisierten Aussprachevarianten weiter zu erhöhen <strong>und</strong> Wortübergänge<br />

besser modellieren zu können, wurde ein Varianten-Folgemodell trainiert. Der Einsatz dieses Folgenmodells<br />

zur Auswahl der Aussprachevariante erfolgte mittels des folgenden Algorithmus:<br />

(1) Berechnung der Sprachmodell-Wahrscheinlichkeit.<br />

(2) Berechnung der initialen relativen Wortdauern mittels der aus dem Sprachmodell bestimmten<br />

Wortfolgenwahrscheinlichkeit.<br />

(3) Rücksetzen der Akzentpunkte: Alle Wortdauern von Wörtern mit akzentuierten Silben werden<br />

auf 1 gesetzt.<br />

(4) Glättung der relativen Wortdauern.<br />

(5) Berechnung der Wortzieldauern aus den relativen Wortdauern. Eine relative Dauer von 1 entspricht<br />

dabei einer kanonischen Realisierung.<br />

(6) Erstellen eines Markov-Graphen für jede zu synthetisierende Äußerung. Jeder Knoten des<br />

Graphen steht dabei für eine Variante <strong>und</strong> ist mit einer eindimensionalen Gaußdichtefunktion<br />

gekoppelt, welche die Dauer dieser Variante beschreibt. Die Kanten des Graphen tragen Übergangsgewichte,<br />

welche mittels Varainten-Folgemodells bestimmt sind.<br />

(7) Suche des besten Pfades durch den Graphen <strong>und</strong> Auswahl der darauf liegenden Varianten.<br />

29


Forschung<br />

Die Auswahl der Aussprachevarianten mittels Markov-Graphen kann wie folgt dargestellt werden:<br />

Wenn { w1 o Lo<br />

w2}<br />

eine zu synthetisierende Wortfolge darstellt <strong>und</strong> A(<br />

wi<br />

) die Menge der Varianten<br />

des Wortes w , dann kann das Aussprachemodell G dieser Wortfolge wie folgt als stochastischer<br />

i<br />

Markov-Graph (SMG) ausgedrückt werden:<br />

{ { } } ) ( ) ( V E<br />

V , E,<br />

N , ν ,<br />

G =<br />

π<br />

Dabei entspricht V der Knoten- <strong>und</strong> E der Kantenmenge. Die Menge { N } der eindimensionalen<br />

Gaußverteilungen wird durch ein Realignment abgeleitet <strong>und</strong> beschreibt die Dauer der Aussprachevarianten.<br />

( V )<br />

Die Zuordnung : V → { N}<br />

E → ℜ<br />

ν weist jedem Knoten eine Gaußfunktion zu, wobei<br />

jeder Kante ein Übergangsgewicht zuweist. Die Knoten- <strong>und</strong> Kantenmengen werde wie folgt gebildet:<br />

U<br />

wi<br />

V = A(<br />

wi<br />

) <strong>und</strong> E = U A(<br />

wi<br />

) × A(<br />

wi−1<br />

)<br />

wi<br />

Jede Kante steht für einen Übergang von der Variante Α s (gekennzeichnet durch den Anfangsknoten<br />

vs ) zur Variante e (gekennzeichnet durch den Endknoten ). In Abbildung 15 ist ein Beispiel für<br />

ein Aussprache-SMG der Äußerung {morgens ○ zwischen ○ acht ○ <strong>und</strong> ○ neun} dargestellt.<br />

Α ve<br />

Abbildung 15: Stochastischer Markov-Graph (SMG) der Aussprachevarianten der Äußerung {morgens<br />

○ zwischen ○ acht ○ <strong>und</strong> ○ neun}. Knoten stellen Aussprachevarianten dar <strong>und</strong> Kanten enthalten<br />

die aus dem Aussprachesprachmodell ermittelten Gewichte. Der fett gezeichnete Pfad kennzeichnet<br />

den ausgewählten Pfad unter Beachtung des Varianten-Folgemodells. Dieses Beispiel zeigt die korrekte<br />

Berücksichtigung von Wortübergängen, z. B. Auslassung des /t/ <strong>und</strong> Angleichung des /s/ zwischen<br />

den ersten beiden Wörtern. Zum Vergleich zeigt der gestrichelte Pfad die Variantenauswahl nur<br />

unter Verwendung des kanonischen Sprachmodells <strong>und</strong> der Zieldauer.<br />

Wenn der Markov-Graph G erster Ordnung ist, dann ist 2 die maximale n-Gramm Ordnung, welche<br />

für das Übergangsgewicht verwendet wird. So werden die Kanten mittels Interpolation von Zero-<br />

Grammen, Uni-Grammen <strong>und</strong> Bi-Grammen wie folgt gewichtet:<br />

30<br />

( P(<br />

Α | Α ) ) = ln(<br />

f ⋅ P(<br />

Α | Α ) + f ⋅ P(<br />

Α ) + f ⋅ )<br />

w vs<br />

, ve<br />

) ln e s<br />

2 e s 1 e<br />

( = P ,<br />

0<br />

0<br />

π<br />

( E )<br />

:


Forschung<br />

wobei , <strong>und</strong> die Gewichte der einzelnen n-Gramme <strong>und</strong> P die Zero-Gramm- Wahr-<br />

f 0 f1 f 2<br />

0<br />

scheinlichkeit kennzeichnen.<br />

Die Verwendung von SMG’s höherer Ordnung ist prinzipiell möglich, erfordert jedoch einen enormen<br />

Datenaufwand, um eine gesicherte statistische Aussage über mehrere aufeinander folgende Aussprachevarianten<br />

treffen zu können.<br />

Wenn die absolute Länge d i = d(<br />

wi<br />

) des Wortes wi<br />

einer zu synthetisierenden Äußerung gegeben<br />

ist, kann die optimale Folge der Aussprachevarianten als<br />

[ w(<br />

Α | Α ) + γ ln p(<br />

d | N ]<br />

arg max ∑ i i−1<br />

A∈G<br />

Αi∈A<br />

*<br />

A =<br />

)<br />

bestimmt werden, wobei w( Ai<br />

| Ai−1<br />

) das Kantengewicht des Überganges Ai− 1 o Ai<br />

<strong>und</strong> p(<br />

d i | N i )<br />

die Wahrscheinlichkeitsdichte der gewünschten Wortlänge d (aus der Dauerstatistik der Aussprache-<br />

variante Α ) darstellt. Mit dem Skalierungsfaktor γ kann eingestellt werden, ob die gewünschte Wort-<br />

i<br />

länge oder die wahrscheinlichste Wortfolge stärker beachtet wird.<br />

Die Syntheseexperimente haben gezeigt, dass gegenüber der reinen Variantenauswahl mittel<br />

s„normalen“ Sprachmodell (vgl. Jahresbericht 2003) die zusätzliche Verwendung eines Aussprache-<br />

Sprachmodells eine bedeutende Steigerung der Spontanssprachlichkeit zur Folge hat, jedoch nur<br />

leichte Verbesserungen im Bereich der Natürlichkeit (vgl. Tabelle 1) bringt.<br />

Tabelle 1: Ergebnisse des Hörtests mittels Paarvergleich<br />

„Reine“ Varaintenauswahl<br />

i<br />

i<br />

i<br />

Variantenfolgemodell<br />

Verständlichkeit 15,8 % 22,3%<br />

Natürlichkeit 53,3 % 54,4 %<br />

Spontansprachlichkeit 64,6 % 73,7 %<br />

MOS (kanonisch: 3,21) 2,85 2,93<br />

Allerdings zeigen die Ergebnisse auch, dass die meisten Hörtestteilnehmer die kanonische Synthese<br />

als verständlicher bewertet haben. Beachtet man jedoch, dass jede über-artikulierte Ausspracheform<br />

in der Regel verständlicher ist als eine reduzierte Variante (auch bei natürlicher Sprache), so ist dieses<br />

Ergebnis nicht überraschend.<br />

Die Verwendung von Aussprachesprachmodellen erhöht nicht nur die Qualität der Sprachsynthese,<br />

sondern kann auch im Bereich der Spracherkennung Verbesserungen hervorrufen. Die Verwendung<br />

von Aussprachewörterbüchern in der Erkennung wird schon seit langem untersucht. Jedoch wurden<br />

nur Verbesserungen der Erkennungsrate erreicht, wenn durchschnittlich nur 1,1 bis 1,5 Varianten pro<br />

Wort verwendet wurden. Die Verwendung von mehr Varianten erhöht die Verwechslungswahrscheinlichkeit<br />

in der Art, dass die Erkennungsraten sinken.<br />

Das Wörterbuch für die Syntheseexperimente enthielt durchschnittlich 2,8 Varianten pro Wort, in früheren<br />

Experimenten haben wir sogar mit 3,7 Varianten pro Wort gearbeitet. Tabelle 2 zeigt, wie stark<br />

die Erkennungsraten sinken, wenn man ein kanonisches Wörterbuch durch ein solches Variantenwörterbuch<br />

ersetzt. Verwendet man nun statt des kanonischen Sprachmodells das Variantensprachmodell,<br />

so erhöht sich die Erkennungsrate wieder. Man erreicht aber noch nicht die Ergebnisse wie mit<br />

rein kanonischem Wörterbuch <strong>und</strong> Sprachmodell. Die Verwendung von Aussprachesprachmodellen in<br />

der Erkennung könnte aber ein Ausweg sein, wenn man auf die Verwendung von Variantenwörterbüchern<br />

angewiesen ist.<br />

Tabelle 2: Erkennungsergebnisse<br />

Setup Korrektheit<br />

Kanonisches Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 76,6 %<br />

Varianten-Wörterbuch + Kanonisches Bi-Gramm Sprachmodell 61,8 %<br />

Varianten-Wörterbuch + Varianten Bi-Gramm Sprachmodell 68,8 %<br />

31


Forschung<br />

b) Methoden zur Verarbeitung von Finite State Machines<br />

Die auf STL basierende FSM-Bibliothek (C++) wurde in C umgeschrieben (neue dLabPro-Komponente)<br />

<strong>und</strong> erweitert, um mit dem Log-Semiring <strong>und</strong> Probability-Semiring arbeiten zu können.<br />

Weiterhin erfolgte eine Implementierung des „FSM Katz’ Back-Off“-Sprachmodells, die hier kurz erläutert<br />

werden soll. Ausgangspunkt ist, dass FSM-Sprachmodelle zwei Anforderungen erfüllen müssen:<br />

• Gewichtschätzungskorrektheit: Die Haupteigenschaft gewichteter FSM für Spracherkennungsaufgaben<br />

ist ihre Fähigkeit, Red<strong>und</strong>anz ohne Informationsverlust zu verringern. Damit diese Eigenschaft<br />

völlig ausgenutzt werden kann, sollten die Gewichte zweckmäßig berechnet werden, um<br />

sinnvolle Aussagen <strong>und</strong> Vergleiche zu ermöglichen. Diese Aufgabe fordert ein geeignetes<br />

Sprachmodell, das die korrekte Schätzung der Gewichte gewährleistet.<br />

• Pfadkontinuität: Die einfachste Art eines stochastischen Sprachmodels ist ein n-Gram, ein Modell,<br />

das eine natürliche Verkörperung eines FSMs erlaubt. Wenn ein Worthypothesen-FSM mit einem<br />

Sprachmodell-FSM komponiert wird, ergibt sich ein neues FSM, welches nur diejenigen Sätze aus<br />

der Worthypothese beinhaltet, die vom Sprachmodell akzeptiert wurden. Diese Prozedur hat den<br />

Hauptnachteil, dass keine korrekten Ergebnisse erzeugt werden, falls die Worthypothese die<br />

Wortsequenz w1-wn enthält, aber im Sprachmodell das n-gram wn| w1-wn-1 nicht existiert.<br />

Katz schlug eine Methode basierend auf der Arbeit von Good-Touring zur Schätzung von n-Gram-<br />

Wahrscheinlichkeiten vor, wenn diese wegen Mangels an Information nicht zur Verfügung stehen.<br />

Deshalb müssen nicht trainierte n-Grams wn| w1-wn-1 geschätzt werden, ohne dass die Suche durch<br />

das FSM-Sprachmodell unterbrochen wird.<br />

Die theoretische <strong>und</strong> praktische Implementierung des Katz-Sprachmodells in der Form eines FSMs<br />

wurde in einem Forschungsbericht ausführlich erklärt.<br />

Das Sprachmodell wurde anhand mehrerer Word-Lattice-Hypothesen geprüft, <strong>und</strong> erwartungsgemäß<br />

erhält das höchste Score diejenige Wortfolge, der die höchste Wahrscheinlichkeit im Sprachmodell<br />

zugewiesen wurde, was letztendlich vom Trainingskorpus abhängt. Die Abbildungen 16 bis 18 schildern<br />

ein einfaches Beispiel für die Worthypothese H1, “D A B”, ein FSM-Katz-Sprachmodell für den<br />

Satz „A B C D“ <strong>und</strong> den Suchpfad (Strichlinie). Die Wahrscheinlichkeit des Satzes “D A B.” ist das<br />

Produkt aller Kantengewichte.<br />

32<br />

s<br />

P(“D A B.”) = αs * PGT(D) * αD * PGT (A) * PGT (B|A) * αAB * αB * PGT (.)<br />

A<br />

A/PGT(A)<br />

φ/αs<br />

NH<br />

0<br />

D / 1 A / 1 B / 1 . / 1<br />

1 2 3<br />

4<br />

Abbildung 16: Worthypothese H1.<br />

C D<br />

sAB ABC BCD<br />

B C<br />

φ<br />

sA AB BC CD<br />

φ<br />

B/PGT(B|A)<br />

φ/αAB<br />

C<br />

φ<br />

D<br />

φ<br />

A B C<br />

φ<br />

φ/αB<br />

B<br />

φ<br />

D/PGT(D)<br />

C<br />

φ<br />

φ/αD<br />

D<br />

D<br />

.<br />

.<br />

. /PGT(.)<br />

Abbildung 17 Die Strichlinie zeigt Back-Off-Komposition zwischen<br />

H1 <strong>und</strong> dem grau gefärbten Sprachmodell.<br />

.<br />

END


S<br />

Forschung<br />

D/αs ε/PGT(D) A/αD ε/PGT(A) B/PGT(B|A) ./αAB ε/αB ε /PGT(.)<br />

NH<br />

D NH<br />

A<br />

AB B NH<br />

END<br />

Abbildung 18 Resultierendes FSM nach der Back-Off-Komposition.<br />

c) Stimmaktivierung eines Spracherkenners<br />

Die Aktivierung eines Spracherkenners stellt einen kritischen Faktor für den praktischen Einsatz von<br />

Sprachtechnologien dar. Aktuelle Systeme erfordern meist eine manuelle Bedienung per Tastendruck<br />

(„push-to-talk“) zum Freischalten des Erkenners. Für viele Anwendungen stellt die Aktivierung per<br />

Sprache eine sinnvolle Alternative dar. Bei der Stimmaktivierung kommen als Schlüsselwörter oft exotische<br />

Ansprechwörter zum Einsatz, welche in normaler Unterhaltungssprache sehr selten auftreten.<br />

Dies soll irrtümliche Aktivierungen des Erkenners vermeiden. Unter dem Blickwinkel der Benutzerakzeptanz<br />

sind solche exotischen Schlüsselwörter jedoch kritisch zu betrachten. In aktuellen Stimmaktivierungssystemen<br />

finden prosodische Faktoren wie die Stimmmelodie, die Intensität oder die Wort-<br />

bzw. Silbendauer kaum Beachtung. Man kann jedoch experimentell zeigen, dass Benutzer beim Ansprechen<br />

eines Sprachdialogsystems das entsprechende Schlüsselwort besonders betonen (siehe<br />

Abbildung 19). Daher haben wir ein Verfahren zur Integration prosodischer Merkmale in die Schlüsselworterkennung<br />

zur Stimmaktivierung entwickelt [5]. Die primäre Zielsetzung bestand in einer Verbesserung<br />

der Robustheit der Stimmaktivierung bei gleichzeitigem Verzicht auf exotische Schlüsselwörter.<br />

Es wurde experimentell untersucht, inwiefern prosodische Merkmale dazu beitragen können,<br />

das Auftreten eines bestimmten Schlüsselworts beim Ansprechen des Erkenners vom Auftreten desselben<br />

Wortes innerhalb normaler Unterhaltungssprache zu unterscheiden.<br />

normalized F 0<br />

k O m p j u: t E 6 label<br />

Abbildung 19: F0 Konturen des Schlüsselwortes „Computer“ aus Kommandophrasen (command) <strong>und</strong><br />

normaler Sprache (non-command).<br />

Zur Modellierung der prosodischen Merkmale des Ansprechwortes wurde ein auf den Gr<strong>und</strong>frequenz-<br />

<strong>und</strong> Intensitätsverlauf trainiertes Hidden-Markov-Modell in einen Kommandoerkenner integriert (siehe<br />

Abbildung 20). Die prosodische Erkennungsleistung des erstellten Modells wurde mit den Erkennungsresultaten<br />

von menschlichen Versuchspersonen in einem Hörtest verglichen. Für eine identische<br />

Aufgabenstellung erreichte das trainierte Modell mit einer Erkennungsrate von 74,2% bei einer<br />

Fehlalarmrate (irrtümliche Aktivierung) von 25,5% nur geringfügig schlechtere Ergebnisse als die<br />

menschlichen Versuchspersonen. Diese erzielten eine mittlere Erkennungsrate von 81% bei einer<br />

Fehlalarmrate von 29%. Durch die Integration des prosodischen Modells in die Kommandoerkennung<br />

erfolgte eine zusätzliche Verifikation der Schlüsselworthypothesen des phonetischen Erkenners. Als<br />

Resultat dieser Überprüfung konnte die Equal Error Rate (gleiche Anzahl von Fehlaktivierungen <strong>und</strong><br />

Fehlrückweisungen) von 13,1% auf 6,9% verringert werden. Die Kommandoerkennungsrate wurde im<br />

Experiment gleichzeitig von 85,1% auf 91,4% gesteigert. Durch eine alternative Rückweisungsstrategie,<br />

basierend auf einer Abstandsklassifikation der Konfidenzmaße, konnte die Erkennungsrate weiter<br />

auf 93,6% erhöht <strong>und</strong> die Anzahl der Fehlaktivierungen auf 2,2% reduziert werden.<br />

time<br />

33


Forschung<br />

Abbildung 20: Blockschaltbild des Spracherkenners, bestehend aus drei wesentlichen Bestandteilen:<br />

Kompilation des Erkennungsnetzwerks, Spracherkenner <strong>und</strong> Referenzerkenner (freie Phonemerkennung)<br />

zur Berechnung von Konfidenzwerten <strong>und</strong> zur Rückweisung. Die grau hinterlegten Bereiche<br />

markieren die prosodische Schlüsselwortverifikation<br />

d) Prosodie-Komponente von UASR<br />

Von den Komponenten von UASR ist bisher die Implementierung der prosodischen „Klammer“, die<br />

sich um den Analyse- <strong>und</strong> Synthesezweig legt, am wenigsten fortgeschritten. Die besonders durch die<br />

Entwicklung von DRESS vorliegenden Erfahrungen sollen im Rahmen des Promotionsvorhabens von<br />

Herrn Oba hier einfließen. Im Berichtsjahr konzentrierte er sich besonders auf den Zusammenhang<br />

von Dialekt <strong>und</strong> Intonation <strong>und</strong> führte dazu vergleichende Untersuchungen anhand des Verbmobil-<br />

Korpus durch. Die vorläufigen Ergebnisse wurden zum Prager Workshop veröffentlicht [6].<br />

e) UASR-Resynthese-Experimente<br />

Die UASR-Architektur ermöglicht die Resynthese von einem erkannten Sprachsignal, dessen Fehler<br />

akustisch erkannt werden können, was ein zusätzliches Werkzeug zur Fehleridentifizierung darstellt.<br />

Anhand dieses Konzepts wurden die ersten Blöcke unseres experimentellen Systems untersucht.<br />

34


Forschung<br />

Abbildung 21 stellt den Signalfluss vom Sprachsignal zum Laut sowie das entsprechende synthetisierte<br />

akustische Signal in jedem Zwischenschritt dar.<br />

Abbildung 21: Signalfluss Resynthese.<br />

Das Experiment bewies, dass kein wahrnehmbarer Informationsverlust nach der Merkmalextraktion<br />

<strong>und</strong> Merkmalraumreduktion (Cepstrum analysis and PCA) stattfand.<br />

Die Verständlichkeit des Sprachsignals nach der Vektorquantizierung verschlechtert sich drastisch,<br />

denn die trainierten Phonemmodelle sind nicht akkurat genug. Ein zusätzliches Problem tritt auf wenn<br />

die erkannten Phoneme synthetisiert werden, da die Pitch-Information (Tonhöhe) an die neuen Merkmale<br />

angepasst werden soll.<br />

Ein weiteres Problem ist die Tatsache, dass die Pitch-Information nach der Merkmalextraktion nicht<br />

mehr zur Verfügung steht. Deshalb muss sie künstlich hinzugefügt werden, was die Fehleridentifizierung<br />

in gewissem Maße in einen subjektiven Prozess verwandelt.<br />

Zum Thema „Fehleranalyse von Phonemhypothesengraphen“ wurde eine Studienarbeit angefertigt<br />

[7].<br />

f) Anwendung auf nichtsprachliche Signale I: Qualitätsbewertung technischer Prozesse<br />

Das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer<br />

Prozesse“ wurde im Dezember 2003 bewilligt. Dieses Projekt wird gemeinsam mit dem Fraunhofer<br />

Institut für Zerstörungsfreie Prüfverfahren (IZFP-D) <strong>Dresden</strong> bearbeitet. Dabei werden von technischen<br />

Prozessen stammende Signale klassifiziert.<br />

Klassifikationsverfahren<br />

Das entwickelte Klassifikationsverfahren beruht auf Algorithmen der Folgenklassifikation sowie Methoden<br />

zur Strukturaufdeckung, also zum automatischen Lernen von endlichen Zustandsautomaten.<br />

Abbildung 22 zeigt ein Konzept für das Verfahren. Zur Merkmalextraktion wurde die Spektraltransformation<br />

verwendet. Die Merkmalkompression erfolgte durch Zusammenfassen von Vektorkomponenten<br />

sowie durch lineare Transformationen (Karhunen-Loeve-Transformation). Das akustische Modell<br />

wurde durch ein SMG-Modell (Stochastischer Markov-Graph 1. Ordnung) realisiert.<br />

35


Forschung<br />

Abbildung 22: Konzept für ein Folgenklassifikationsverfahren für technische Signale mit den folgenden<br />

wesentlichen Bausteinen: Merkmalextraktion, Klassifikation durch ein akustisches Modell, Selbstkontrolle<br />

der Klassifikation durch Auswertung eines Konfidenzmaßes, bei Rückweisung manuelle<br />

Klassifikation <strong>und</strong> Nachtraining. Der Arbeitspunkt der Selbstkontrolle wird als angemessener Kompromiss<br />

zwischen Fehlrückweisungs- <strong>und</strong> Fehlakzeptanzrate (FAR/FRR) gewählt.<br />

Methoden für das automatische Anlernen<br />

Ein weiterer Schwerpunkt des Projekts liegt auf der Erforschung <strong>und</strong> Entwicklung von datengetriebenen<br />

Trainingsmethoden. Alle Wissensquellen des Klassifikators sollen automatisch durch Anlernen mit<br />

einer (von Hand) klassifizierten, möglichst kleinen Trainingsstichprobe aufgebaut werden.<br />

Für den Klassifikator wurden folgende Wissensquellen trainiert:<br />

• die Merkmalstatistik <strong>und</strong> daraus abgeleitete Eigenvektormatrix für die Merkmaltransformation,<br />

• die Struktur der endlichen Zustandsautomaten des akustischen Modells,<br />

• die Emissionsverteilungsdichten des akustischen Modells sowie<br />

• ggf. Rückweisungsschwellwerte.<br />

36


Forschung<br />

Der Schwerpunkt für die Erforschung der Trainingsmethoden lag auf der automatischen Strukturaufdeckung,<br />

da hier das größte zusätzliche Potential im Vergleich mit herkömmlichen Klassifikationsmethoden<br />

erwartet wurde.<br />

Abbildung 23 zeigt ein erstes Konzept für ein mögliches Trainingsverfahren, welches an Prinzipien der<br />

Klassifikation von Sprachsignalen angelehnt ist.<br />

Lernstichprobe<br />

Signal Klassen<br />

Merkmalextraktion<br />

Merkmalvektoren<br />

Merkmalkompression<br />

Merkmalvektoren<br />

Viterbi<br />

Training<br />

Modellversäuberung<br />

Merkmalstatistik<br />

Modellinitialisierung<br />

Weltmodell<br />

Akustisches<br />

akustisches<br />

Modell<br />

Klassenmodelle<br />

Gaußmodelle<br />

teilen<br />

Klassenmodelle<br />

Klassenmodelle<br />

Klassenmodelle<br />

(klassenabhänige)<br />

Statistik<br />

Klassenmodelle<br />

Reklassifikation<br />

Abbildung 23: Konzept für ein vollautomatisches, datengetriebenes Training für die Klassifikation<br />

technischer akustischer Signale<br />

Experimente<br />

Bereits im Jahresbericht 2003 wurden die ersten durchgeführten Fallbeispiele zur Eignung der Folgenklassifikation<br />

für technische Signale beschrieben.<br />

In diesem Jahr lag der Schwerpunkt der Anwendungen auf mikrofluidischen Bauelementen. Die Prüfaufgaben<br />

dabei bestanden neben der Unterscheidung zwischen neuwertigen <strong>und</strong> gebrauchten Baulelementen<br />

in der Durchführung einer Lebensdaueranalyse mit dem Ziel, einen bevorstehenden Ausfall<br />

rechtzeitig zu erkennen. Die Untersuchungen wurden in Form eines Dauerversuches durchgeführt, bei<br />

dem Ventile zyklisch geöffnet <strong>und</strong> geschlossen wurden. Die Signale während des Schließvorganges<br />

wurden aufgezeichnet <strong>und</strong> mittels UASR klassifiziert. Zu diesem Zwecke wurden verschiedene akustische<br />

Modelle entsprechend des Lebensalters der Ventile angelernt. Das Anlernen erfolgte über n<br />

Ventile, wobei es galt, das (n+1)-te Ventil mittels der trainierten Modelle zu klassifizieren bzw. dessen<br />

Zustand möglichst genau zu analysieren.<br />

Zum Training jedes Klassenmodells wurden jeweils 1000 Daten verwendet. Verschiedene Modelle<br />

wurden gebildet:<br />

− Neu (Modell aus neuwertigen Ventilen)<br />

− Mittel (Modell aus Ventilen mittlerer Lebenszeit)<br />

− Alt (Modell aus alten Ventilen)<br />

37


Forschung<br />

Im folgenden Beispiel (Abbildung 24) wurden die Trainingsmodelle aus Daten der Ventile 2 <strong>und</strong> 3 gebildet,<br />

klassifiziert wurde Ventil 5. Dargestellt sind die Modelle Alt <strong>und</strong> Neu sowie die Differenz aus Alt<br />

<strong>und</strong> Neu, das die beste Tendenzanzeige lieferte.<br />

Abbildung 24: Beispiel – Akustische Lebensdaueranalyse von Ventilen.<br />

g) Erkennung nichtsprachlicher Objekte II: Nichtinvasive Blutdruckmessung am aktiven Menschen<br />

Ein besonderes Problem bei der messtechnischen Erfassung von Blutdruckwerten stellen Messungen<br />

am aktiven Probanden dar. Als Messverfahren sollte die akustische Auswertung der sogenannten<br />

Korotkow-Geräusche verwendet werden, worauf üblicherweise die „klassische“ Blutdruckmessung in<br />

der Alltagsmedizin beruht. Durch eine geeignete Messanordnung <strong>und</strong> nachfolgende Signalverarbeitung<br />

bzw. –auswertung soll dieses Verfahren auch für die Blutdruckmessung am aktiven Menschen,<br />

d. h. unter gestörten Bedingungen, eingesetzt werden.<br />

Auf Gr<strong>und</strong> des Charakters der Störkomponenten scheinen einfachere Detektionsalgorithmen für die<br />

beiden Messzeitpunkte Anfang <strong>und</strong> Ende des Korotkow-Geräuschs wenig aussichtsreich. Aus diesem<br />

Gr<strong>und</strong> wurde auf einen Mustererkennungsansatz orientiert, wie er z. B. im Bereich der automatischen<br />

Spracherkennung für die Detektion von bestimmten Schlüsselwörtern in Wortketten verwendet wird.<br />

Als Merkmale kommen spektrale Koeffizienten zum Einsatz (256-Punkte-Fast-Fouriertransformation,<br />

Fortsetzrate: 128 Abtastwerte), die vom amplitudennormierten Messsignal berechnet werden. In einer<br />

Merkmalauswahlstufe wird die Anzahl der Koeffizienten auf 9 logarithmierte reduziert. Der Merkmalsatz<br />

wurde durch Delta- <strong>und</strong> Delta-Delta-Koeffizienten <strong>und</strong> die mittlere Signalenergie komplettiert.<br />

Der Vergleichsalgorithmus beruht auf einem Abstandsfolgenklassifikator (euklidischer Abstand), der in<br />

seinen Randbedingungen an die vorliegende Aufgabe angepasst wurde.<br />

In der Vergleichsstufe wurde nun für jedes Messsignal das aus dem jeweils ungestörten Signal manuell<br />

extrahierte Korotkow-Geräusch mit Hilfe der oben angeführten Klassifikationsstrategie im gestörten<br />

Signal gesucht <strong>und</strong> entsprechend Anfangs- <strong>und</strong> Endpunkt detektiert.<br />

Unter Vernachlässigung der offensichtlich durch grobe Messfehler beeinträchtigten Messsignale in der<br />

vorliegenden Stichprobe wurden mit dem beschriebenen Mustererkennungsansatz ca. 60 % Signaldetektion<br />

erreicht (156 Messsignale). Das Ergebnis kann verbessert werden, wenn das sehr „harte“<br />

Klassifikationskriterium (Summe der Abweichungen von absoluter Anfangs- <strong>und</strong> Endposition des<br />

Korotkow-Geräuschs) dahingehend verändert wird, dass die relativen Positionen zueinander stärker<br />

bewertet werden.<br />

38


Forschung<br />

Abbildung 25 zeigt die Abhängigkeit der Detektionsrate vom Klassifikationskriterium (Summe der Abweichungen<br />

von detektiertem Anfangs- <strong>und</strong> Endpunkt des Korotkowgeräuschs in mmHg).<br />

Literatur zu 3.2.1<br />

Abbildung 25: Klassifikationsergebnis in Abhängigkeit vom Klassifikationskriterium.<br />

[1] R. Hoffmann, M. Eichner, S. Werner, and M. Wolff, „The Project UASR (Unified Approach for<br />

Speech Synthesis and Recognition) – A Progress Report“, Proc. Speech Processing Workshop,<br />

DAGM 2003, Magdeburg, Germany, p. 17-24.<br />

[2] M. Eichner, M. Wolff and R. Hoffmann, „Voice characteristics conversion for TTS using reverse<br />

VTLN“, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 17-20 , 2004.<br />

[3] S. Werner, M. Eichner, M. Wolff and R. Hoffmann, „Modelling Pronunciation Variation for<br />

Spontaneous Speech Synthesis “, Proc. ICASSP 2004, Montreal, Canada, Vol. 1, pp. 673-676 ,<br />

2004.<br />

[4] C. Tschöpe, D. Hentschel, M. Wolff, M. Eichner and R. Hoffmann, „Classification of non-speech<br />

acoustic signals using structure models“, Proc. ICASSP 2004, Montreal, Canada, Vol. 5 , pp. 653-<br />

656, 2004.<br />

[5] M. Kühne, M. Wolff, M. Eichner and R. Hoffmann, „Voice activation based on prosodic keyword<br />

verification”, Proc. INTERSPEECH, Jeju, South Korea, 2004.<br />

[6] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop Speech<br />

Processing, September 13 – 15, 2004, Prague, 12 – 15.<br />

[7] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen. Studienarbeit TU <strong>Dresden</strong><br />

2004.<br />

3.2.3 Sprachsynthese<br />

a) Gr<strong>und</strong>lagenforschung Prosodie – Optimierung des Integrierten Modells<br />

In den Jahresberichten 2002 <strong>und</strong> 2003 wurde das Integrierte Prosodiemodell des Deutschen (IGM)<br />

vorgestellt. Es arbeitet NN-trainingsbasiert <strong>und</strong> generiert Fujisaki-Ansteuerparameter zur Erzeugung<br />

der Gr<strong>und</strong>frequenzkontur, Silben- <strong>und</strong> Pausendauern sowie Intensitätsverläufe. Das IGM kann mit<br />

verschieden Sprecher- <strong>und</strong> Sprechstildaten trainiert werden. Die Anwendbarkeit auf andere Sprachen<br />

wurde nachgewiesen.<br />

Im Zuge der weiteren Optimierung des Ansatzes wurden die einzelnen Parameter (wie z. B. die<br />

Sprechintensität, vgl. Jahresbericht 2003) genauer untersucht. Es wurden folgende Ansatzpunkte für<br />

eine Optimierung des IGM identifiziert:<br />

39


Verringerung des MSE gegenüber MFN (%) _<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

-5<br />

-10<br />

Weglassen außerhalb von |3S|<br />

ein Eingang |3S|<br />

zwei Eingänge ±3S<br />

Forschung<br />

AA T1_DI T2_DI AP_L DIST_ PAUSE DUR ENERG<br />

Untersuchter Parameter<br />

Abbildung 26: Automatische Markierung von Extremwert-Daten.<br />

• Berücksichtigung zusätzlicher Eingangsinformation: Das Modell berücksichtigte z. B. keine Elemente<br />

von Bedeutung, semantic focus oder abgeleitete Merkmale.<br />

• Strukturoptimierung des Neuronalen Netzwerkes: Die neuronale Struktur des Netzwerkkerns<br />

des IGM wurde entsprechend den Erfahrungen mit ähnlichen Prediktionsaufgaben implementiert.<br />

Ein evolutionärer Algorithmus soll Red<strong>und</strong>anzen in der Topologie reduzieren <strong>und</strong> die<br />

Signifikanz verbleibender Neuronen, Eingangsmerkmale, etc. in weiteren Trainingszyklen erhöhen.<br />

• Verringerung der Rechenkomplexität bzw. des Speicherverbrauchs: IGM konnte nicht in einem<br />

Embedded Text-to-Speech (TTS-)System implementiert werden.<br />

Zusätzliche Qualifizierung der IGM-Eingangsmerkmale (Ergebnisse)<br />

Eine semantische Erweiterung der Eingangsmerkmale des IGM ist in der Praxis kompliziert, da die<br />

entsprechenden Informationen nicht nur in der Trainingsdatenbasis zuverlässig markiert werden, sondern<br />

auch während der Kannphase im TTS-System vorliegen müssen.<br />

Als Zwischenschritt wurde getestet, welchen Einfluss die automatische Markierung von extremen Werten<br />

eines bestimmten Ausgabeparameters auf das Netztraining hat. Für jeden Ausgabeparameter<br />

wurde ein separates neuronales Netz trainiert. Dabei wurden je Parameter vier Konfigurationen untersucht:<br />

• Verwendung des ursprünglichen MFN ohne Änderungen (MFN),<br />

• Eliminierung aller Datensätze aus Trainings- <strong>und</strong> Testmenge, bei denen der Parameter außerhalb<br />

eines Vielfachen n der Standardabweichung S liegt (Weglassen > |nS|),<br />

• Ein zusätzlicher Eingang, ob der Parameter außerhalb eines bestimmten Vielfachen n der<br />

Standardabweichung liegt (ein Eingang > |nS|),<br />

• Zwei zusätzliche Eingänge, ob der Parameter positiv oder negativ außerhalb eines bestimmten<br />

Vielfachen der Standardabweichung liegt (zwei Eingänge, > +nS / < -nS).<br />

Das Training wurde mit Markierungen für die ein- bis dreifache Standardabweichung durchgeführt.<br />

Abbildung 26 zeigt die Ergebnisse für die dreifache Streuung. Bis auf einige Ausreißer beim Training<br />

ist gut zu erkennen, dass alle drei Konfigurationen ähnliche Verbesserungen der Prediktion nach sich<br />

ziehen. Besonders markant ist diese Beobachtung bei den zeitlichen Parametern T1, DIST (T0) bzw.<br />

PAUSE, wo sich der Fehler (MSE) um ca. 20% bis 30% reduziert. In Zusammenhang mit der geringen<br />

Anzahl an Datensätzen, welche dabei markiert werden mussten, ist zu vermuten, dass diese Extremwerte<br />

teilweise auf Label-Ungenauigkeiten in der Datenbasis zurückzuführen sind.<br />

40


Forschung<br />

Evolutionäre Topologieoptimierung des neuronalen Netzwerkkerns von IGM<br />

Evolutionäre Algorithmen (EA) sind Methoden zur stochastischen Optimierung, welchen den natürlichen<br />

Prozess von Evolution, Selektion <strong>und</strong> Variation simulieren. Aufgr<strong>und</strong> mehrerer Optimierungsparameter<br />

(multikriterielles Optimierungsproblem) sowie der Topologie des IGM fiel die Wahl auf den<br />

Strength Pareto Evolutionary Algorithm (SPEA).<br />

Die Struktur eines neuronalen Netzes ist durch zwei Extreme begrenzt: Auf der einen Seite kann das<br />

RMSE _<br />

0,175<br />

0,165<br />

0,155<br />

0,145<br />

0,135<br />

0,125<br />

1 3 5 7 9 11 13 15 17 19 21 23<br />

Netz so klein sein, dass es unfähig ist, alle Trainingsmuster <strong>und</strong> die darin liegenden Zusammenhänge<br />

vollständig zu lernen, auf der anderen Seite kann es zu groß sein, um die angebotenen Daten zu generalisieren<br />

<strong>und</strong> wird jeden Datensatz einzeln lernen. Durch die Nutzung von EA sollten folgenden<br />

Optimierungsziele erreicht werden:<br />

Anzahl Eingänge<br />

Mittelwert-Modell<br />

Originalnetz<br />

Abbildung 27: Optimierungsdurchläufe im Vergleich<br />

zur ursprünglichen Netzleistung.<br />

� Minimierung des mittleren quadratischen Fehlers (MSE bzw. RMSE),<br />

� Minimierung der Anzahl der Verbindungen,<br />

� Minimierung der Anzahl der Eingänge,<br />

� Minimierung der Anzahl der verdeckten Knoten.<br />

Das ursprüngliche MFN besteht aus 24 Eingängen, 744 Verbindungen, 30 verdeckten Knoten <strong>und</strong> 8<br />

Ausgängen. Der minimal beobachtete Overall-RMSE nach dem Training beträgt 0.139.<br />

Zwei größere Konfigurationen (mit 40 <strong>und</strong> 50 verdeckten Knoten) verhalten sich ähnlich wie das ursprüngliche<br />

Netz. Die Verwendung von SPEA zur Reduktion der generellen Netzwerk-Topologie durch<br />

Löschen von Knoten bzw. Verbindungen (wobei nach jedem Durchlauf ein erneutes MFN-Training<br />

mittels Backpropagation erfolgt) zeigt ebenfalls keine signifikante Änderung des resultierenden RMSE.<br />

Unter Berücksichtigung mehrstündiger Evolutionsdurchläufe wurde das Experiment nach einigen h<strong>und</strong>ert<br />

Iterationen beendet.<br />

Eine Reduktion der Eingangsanzahl mittels SPEA zeigt die beabsichtigte Wirkung. Ein optimiertes<br />

Netzwerk mit nur sechs Eingangsparametern verursacht eine RMSE-Erhöhung von lediglich 4.4%<br />

gegenüber dem Originalnetz (Abbildung 27). Frühere Korrelationsanalysen bestätigen, dass ca. 80 bis<br />

95% der Vorhersageleistung von nur 5-8 Eingabeparametern abhängen. Subjektive Tests zeigen keine<br />

hörbaren Unterschiede zwischen den optimierten bzw. den ursprünglich geschätzten Gr<strong>und</strong>frequenz-<br />

<strong>und</strong> Dauerverläufen.<br />

41


Inkonsistenz von Trainingsdaten<br />

Forschung<br />

Ein weiteres evolutionäres Experiment beschäftigte sich mit der korrekten Auswahl von Trainings- <strong>und</strong><br />

Testmustern. Während des ursprünglichen Trainings des IGM wurden die Aufnahmebedingungen des<br />

verwendeten Teils des Stuttgarter Nachrichtenkorpus als konstant angenommen. Da die SPEA jedoch<br />

eine spezifische Vorliebe für bestimmte Trainings- <strong>und</strong> Testmengen-Kombinationen aufzeigte, wurden<br />

Inkonsistenzen in den Trainingsdaten entdeckt – wie z. B. unterschiedliche RMS-Signalwerte, welche<br />

beispielsweise durch unterschiedliche Normierungen, wechselnde Aufnahmetechnik oder unterschiedliche<br />

Sprecher bzw. Sprechstile hervorgerufen werden können.<br />

Zusammenfassend wird eingeschätzt, dass die Datenabhängigkeit trainingsbasierter Prosodiemodelle<br />

generell stärker ist - als in früheren Arbeiten angenommen. Die algorithmische bzw. strukturelle Modellierung<br />

ist anscheinend in gewissen Grenzen flexibel.<br />

Literatur:<br />

O. Jokisch, M. Hofmann, Evolutionary Optimization of an Adaptive Prosody Model, Proc.<br />

INTERSPEECH (ICSLP), 797-800, Jeju, Korea, 2004.<br />

O. Jokisch, M. Hofmann, Optimierung einer trainingsbasierten Prosodiegenerierung für Sprachsynthese,<br />

Elektronische Sprachsignalverarb. (Proc. ESSV), 175-182, Cottbus, 2004.<br />

b) Sprachübergreifende Studie zu Glottalisierungseffekten<br />

Die Motivation der Studie ergibt sich aus der notwendigen Selektion von Inventarsprechern, z. B. für<br />

die Sprache Mandarin-Chinesisch sowie die Designunterschiede im Vergleich zu geeigneten Phonem-<br />

bzw. Diphontabellen für die Sprachen Englisch <strong>und</strong> Deutsch.<br />

Eine Glottalisierung ist eine Diskontinuität bzgl. der Periodizität des Sprachsignals, welche die Qualität<br />

konkatenativer Sprachsynthese während der Gr<strong>und</strong>frequenzmanipulation verschlechtern kann. Relevant<br />

sind Systematik <strong>und</strong> Position möglicher Glottalisierungen in verschiedenen Sprachen als auch<br />

geeignete Manipulationsalgorithmen.<br />

Das verwendete Sprachdatenmaterial umfasst Texte sowie isolierte Silben von acht Mandarin-<br />

Muttersprachlern, Texte von je 6 Muttersprachlern US- bzw. UK-Englisch <strong>und</strong> Texte zweier deutscher<br />

Sprecher. Weiterhin wurden Diphoninventare für US, UK <strong>und</strong> Deutsch untersucht.<br />

Amount<br />

150<br />

100<br />

50<br />

0<br />

� � � � � �<br />

� ßÞ �<br />

Á×ÓÐ�Ø�� ËÝÐÐ��Ð�<br />

� ßÞ �<br />

Ì�ÜØ<br />

Non-Tone3<br />

Voiceless<br />

glottal.<br />

normal<br />

Speaker<br />

Abbildung 28: Häufigkeit von Ton3-Varianten für acht Mandarin-<br />

Sprecher. Menge „Non-Tone3“ umfasst fehlerhafte Artikulationen.<br />

Zusammenfassend ergaben sich folgende Resultate:<br />

• Glottalisierungen sind generell schwer vorhersagbar <strong>und</strong> idiosynkratisch für bestimmte Äußerungen<br />

oder Sprecher.<br />

• Sie sind sprecherabhängig <strong>und</strong> erscheinen häufig an initialen <strong>und</strong> manchmal an wort-finalen<br />

Vokalen in allen genannten Sprachen.<br />

• In Mandarin treten Glottalisierungen häufig im Zentrum des Tons 3 <strong>und</strong> manchmal am Ende<br />

des Tons 4 auf (tiefere Gr<strong>und</strong>frequenzpositionen), vgl. auch Abbildung 28.<br />

• Die Auftretenswahrscheinlichkeit an silben-initialen Vokalen ist in Deutsch größer als in Englisch,<br />

aufgr<strong>und</strong> der speziellen Silbenstruktur des Deutschen.<br />

42


Forschung<br />

Die Autoren schlagen eine differenzierte Behandlung der Glottalisierung in jeder Sprache vor. Solange<br />

der Inventarsprecher in seinen Trägerwörtern keine oder wenige Glottalisierungen generiert, erscheint<br />

es unnötig, separate Phoneme für Glottalisierung oder Glottisverschluss zu definieren. Für deutsche<br />

Sprachsynthese sollte Glottalisierung jedoch Phonemstatus erhalten <strong>und</strong> bei der Inventaraufnahme<br />

entsprechend provoziert werden. Betrachtet man die Vielfalt natürlicher Sprache <strong>und</strong> möchte verschiedene<br />

Sprecher, Sprechstile oder ggf. Emotionen synthetisieren, sollte Glottalisierung allerdings<br />

generell modelliert werden.<br />

Literatur:<br />

H. Ding, O. Jokisch, R. Hoffmann, Glottalization in Inventory Construction: A Cross-Language Study,<br />

Proc. ISCSLP, 37-40, Hongkong, 2004.<br />

c) Entwicklungsarbeiten zur Embedded-Sprachsynthese<br />

Sprachsynthese mit geringem Speicherbedarf stellt weiterhin eine Hauptforschungs- <strong>und</strong> Entwicklungsrichtung<br />

am Institut dar. Die entsprechenden Arbeiten zum TTS-System microDRESS <strong>und</strong> die<br />

Siemenskooperation bei der Entwicklung des Systems Papageno Embedded wurden bereits in den<br />

Jahresberichten 2002 <strong>und</strong> 2003 ausführlich beschrieben. Ein entsprechendes Produkt für Deutsch<br />

<strong>und</strong> US-Englisch wird derzeit vermarktet.<br />

Die Arbeiten im Kalenderjahr 2004 konzentrierten sich auf zwei Bereiche:<br />

• Weiterentwicklung der Kerntechnologie: Inventarkodierung <strong>und</strong> akustische Synthese,<br />

• Konzeption <strong>und</strong> Entwicklung weiterer Sprachressourcen (Projekt „New Languages“).<br />

Die Entwicklung der Kerntechnologie läuft synchron zur TUD-eigenen Forschung <strong>und</strong> wird im folgenden<br />

Abschnitt d) beschrieben. Es entstand u. a. eine neuartige Synthesemethode (DFI-SS), die zur<br />

Patentierung angemeldet wurde <strong>und</strong> eine interessante Alternative, z. B. zu PSOLA, darstellt.<br />

Im Folgenden werden die Arbeiten des Projekts „New Languages for Papageno“ dargestellt. Neben<br />

den Stammmitarbeitern der Sprachsynthese wurden diese Arbeiten durch ein Team von Muttersprachlern<br />

(beratende Linguisten <strong>und</strong> Sprachlehrer, <strong>Diplom</strong>anden, etc.) durchgeführt.<br />

Datenbasenkonzept, Sprecherauswahl<br />

Das bereits für microDRESS realisierte Synthesekonzept sieht eine strikte Code-Daten-Trennung vor.<br />

Der akustische Modul ist trotz seiner algorithmischen Effizienz flexibel bezüglich der Basiseinheiten<br />

(Diphon, Silbe, etc.) <strong>und</strong> ermöglicht auch die Selektion aus Varianten (Korpussynthese).<br />

Bei der Integration neuer Sprachen bzw. neuer Sprecherdatenbasen waren allerdings dennoch bestimmte<br />

sprach- oder sprecherspezifische Merkmale zu beachten, u. a.:<br />

• Vorverarbeitungskonforme Phonem- bzw. Diphonsets: Je nach verwendeten Algorithmen/ Lexika<br />

variierten die Spezifikationen (SAMPA, X-SAMPA, TUD, SIEMENS-CT),<br />

• Eignung des Inventarsprechers für die verwendete Inventarkodierung (z. B. AMRWB) bzw. die<br />

Synthesemethode (z. B. PCM/ TD-PSOLA, DFI-SS, etc.),<br />

• ggf. Berücksichtigung von Glottalisierungseffekten.<br />

Die Sprecherauswahl wurde auf Basis von Hörtests objektiviert, wobei sprachenabhängig 5-8 Sprecherinnen<br />

(R<strong>und</strong>funkmedien, Linguistik, Lehrer, Studenten) zur Auswahl standen. Die Bewertung erfolgte<br />

auf Basis von bis zu 6 Beispielphrasen <strong>und</strong> wurde sowohl von jeweils 20 Muttersprachlern als<br />

auch von Expertenhörern aus der Sprachtechnologie (TUD <strong>und</strong> Siemens) durchgeführt.<br />

Interessanterweise wurden teilweise (z. B. Französisch oder Niederländisch) nicht die „professionellsten<br />

Stimmen“ ausgewählt, was in gewissem Widerspruch zur üblichen subjektiven Sprecherauswahl<br />

steht. Außerdem hatte das Kodierungsverfahren einen teilweise wesentlichen Einfluss auf Stimmpräferenzen<br />

bzw. verringerte manchmal die Signifikanz der Auswahl (Unterschiedliche Bewertungen wurden<br />

stark nivelliert, d. h. die Sprachqualität hing v. a. vom Kodierungsverfahren ab, obwohl z. B. das<br />

AMRWB-Verfahren bezüglich Standardbewertungen (wie MOS) sehr gut abschneidet.<br />

Ebenfalls überraschend war die Tatsache, dass Expertenurteile in der Regel gut mit Muttersprachlerurteilen<br />

korrelieren, auch wenn die Sprachkenntnis nicht oder nur beschränkt vorhanden war.<br />

43


Forschung<br />

Literatur:<br />

O. Jokisch, G. Strecha, H. Ding: Multilingual Speaker Selection for Creating a Speech Synthesis<br />

Database, Proc. AST Workshop, Maribor, Slovenia, 2004 (in press).<br />

Generierung von Sprechertexten, Studioaufnahmen<br />

Um die Generierung von neuen Sprachressourcen zu beschleunigen, wurden mehrere neue Tools<br />

entwickelt, welche im Wesentlichen die vorverarbeitungskonforme Definition von Phonem- bzw.<br />

Diphontabellen <strong>und</strong> die automatische Bereitstellung von Sprechtexten (z. B. Trägerwörter) betreffen<br />

wie z. B. das Programm lex2diph. Der manuelle Bearbeitungsaufwand konnte erheblich reduziert werden.<br />

Die umfangreichen Sprachaufnahmen wurden entsprechend dem Stand der Technik im Studio des<br />

<strong>IAS</strong> durchgeführt (Grossmembran-Mikrofon, Laryngograph, Recordingsoftware), wobei neben der<br />

Sprecherin jeweils ein Techniker <strong>und</strong> ein linguistisch-phonetisch vorgebildeter Muttersprachler anwesend<br />

war, um die Qualitätsanforderungen sicherzustellen.<br />

Neben dem Basismaterial für die Inventarerstellung (jeweils mehrere tausend Wörter) wurde je Sprache<br />

zusätzlich ein Prosodiekorpus von 1.000-1.300 Phrasen aufgenommen <strong>und</strong> segmentiert, welcher<br />

für das Training der entsprechenden Prosodiemodelle genutzt wird.<br />

Sprachdatenbearbeitung <strong>und</strong> Inventargenerierung<br />

Die notwendigen automatischen <strong>und</strong> manuellen Arbeiten zur Sprachdatenbearbeitung wie Segmentierung/<br />

Labeln, Periodenmarkierung, iterative Optimierung wurden bereits in früheren Jahresberichten<br />

beschrieben, laufen weitestgehend standardisiert ab <strong>und</strong> stellen keine Forschung oder Entwicklung im<br />

eigentlichen Sinne dar.<br />

Trotz verbesserter Technologie, z. B. Phoneme Aligner, ist der manuelle Aufwand nach wie vor vergleichsweise<br />

hoch, um sprach übergreifend Inventare mit hoher <strong>und</strong> vor allem uniformer, akustischer<br />

Qualität zu generieren. Der iterative Optimierungsprozess nimmt ca. 2-3 Personenmonate in Anspruch.<br />

Neben den bereits realisierten Datenbasen für Deutsch <strong>und</strong> US-Englisch wurden am <strong>IAS</strong> im Jahr 2004<br />

weibliche Syntheseinventare für folgende Sprachen entwickelt <strong>und</strong> fertig gestellt: UK-Englisch, Kastellan-Spanisch<br />

sowie Italienisch. Derzeit befindet sich ein niederländisches Inventar in der Entwicklung.<br />

In Kooperation mit der voiceINTERconnect <strong>Dresden</strong> GmbH entstand außerdem ein französisches<br />

Syntheseinventar.<br />

Alle Inventare erfüllen die microDRESS- bzw. Papageno Embedded-Spezifikation <strong>und</strong> benötigen je<br />

nach Sprache, Qualitätsstufe <strong>und</strong> Kodierung nur 220 bis 1.100 kB Speicher.<br />

d) AMR-WB-basierte akustische Synthese<br />

Für ein Projekt wurde der neben dem im vergangenen Jahr implementierten AMR-NB (Adaptive Multi<br />

Rate Narrowband)-Dekoder der AMR-WB (Wideband) für die akustische Synthese angepasst. Mit<br />

dem entsprechenden AMR-WB-Kodierer wurden die Inventare erzeugt.<br />

Der AMR-WB-Koder ist, wie der AMR-NB-Koder, ein CELP (Code Excited Linear Prediction) -basierter<br />

Algorithmus. Er arbeitet, im Gegensatz zum AMR-NB intern bei einer Abtastrate von 12.8 kHz. Nach<br />

der Synthese des Sprachsignals durch Filterung des Residualsignals mit den LPC-Koeffizienten findet<br />

ein Hochsamplen auf 16 Khz Abtastrate <strong>und</strong> eine Anreicherung mit höheren Frequenzen, welche aus<br />

dem unteren Frequenzbändern geschätzt werden.<br />

Zum Dekoder übertragen werden die aus den LPC (linear predictive coding) -Koeffizienten ermittelten<br />

LSP (line spectral frequencies) -Koeffizienten <strong>und</strong> Periodenmarkeninformationen sowie die Kodebuchindizees<br />

für die Rekonstruktion des Anregungs- bzw. Residualsignals.<br />

Die akustische Synthese greift vor der Filterung ein, indem die Periode des Anregungssignal durch<br />

ein zeitbasiertes Verfahren manipuliert wird, um die von der Vorverarbeitung generierten Gr<strong>und</strong>frequenzkontur<br />

aufzuprägen. Die Phonemdauern werden durch Einfügen bzw. Auslassen von Anregungssignalperioden<br />

<strong>und</strong> Filterkoeffizienten gesteuert.<br />

44


Inventargenerierung <strong>und</strong> Inventargrößen<br />

Forschung<br />

Ähnlich der Vorgehensweise beim AMR-NB wurden die AMR-WB-Inventare durch bausteinweises<br />

Kodieren erzeugt. Entsprechen den neun Skalierungsstufen des Koders entstanden neun Inventare<br />

pro Inventarstimme. Beispielgrößen eines deutschen Inventars (weibliche Sprecherin) sind in folgender<br />

Tabelle zusammengestellt:<br />

kBit/s: 23,85 23,05 19,85 18,25 15,85 14,25 12,65 8,85 6,6 original<br />

Inventargröße/<br />

Byte:<br />

84858<br />

4<br />

82224<br />

8<br />

71728<br />

8<br />

66480<br />

8<br />

58618<br />

4<br />

53370<br />

4<br />

48122<br />

4<br />

35677<br />

6<br />

28269<br />

8<br />

659696<br />

8<br />

Alle Inventare des Projektes wurden als ROM-Image generiert, d. h., während der Synthese können<br />

keine Änderungen am Inventar vorgenommen werden. Außerdem wurden auf Platformunahbängigkeit<br />

geachtet, wie z. B. Ausrichten (Alignment) der Datentypen an Zeigeradressen. Die entsprechenden<br />

Änderungen am Programmkode der Synthese wurden vorgenommen, sowie die vollständige Umstellung<br />

auf Festkommaarithmetik.<br />

e) Sprechendes Wörterbuch<br />

Wie aus dem Jahresbericht 2003 bekannt ist, entwickelt das Institut für Sprechwissenschaft <strong>und</strong> Phonetik<br />

der Martin-Luther-<strong>Universität</strong> Halle-Wittenberg ein neues Wörterbuch der deutschen Aussprache,<br />

das mit der Möglichkeit versehen werden soll, die Normaussprache gewünschter Wörter mit Hilfe<br />

von Sprachsynthese anhören zu können. Die dafür erforderliche Synthesekomponente wird von unserer<br />

Arbeitsgruppe als Ableitversion von DRESS unter der bezeichnung lexDRESS entwickelt.<br />

Wesentlicher Bestandteil des Projektes ist die Entwicklung einer Diphon-Datenbasis unter Einbeziehung<br />

sprechwissenschaftlicher Expertise. Die Definition einer solchen Datenbasis erfolgte 2003. Im<br />

Berichtsjahr wurden die Trägerwörter von einer geschulten Sprecherin gesprochen, <strong>und</strong> die Diphone<br />

wurden extrahiert.<br />

Als experimentelle Basis wurde von Herrn Sobe eine Oberfläche entwickelt, unter der eine erste Version<br />

von lexDRESS einfach benutzbar ist, indem man die zu sprechenden Wörter in Rechtschrift, der<br />

IPA-Transkription <strong>und</strong> der Transkription mit extended SAMPA darstellen <strong>und</strong> editieren kann.<br />

Da das Projekt ausschließlich durch Haushaltmittel finanziert wird, gelang im Berichtsjahr lediglich die<br />

Erstellung <strong>und</strong> Evaluierung von Synthese-Beispielen unter Benutzung der Rohschnitt-Diphone (siehe<br />

den Bericht zum Projektstand auf der Konferenz ESSV 2004). Damit liegen alle Voraussetzungen für<br />

eine Systemoptimierung im kommenden Jahr vor.<br />

3.2.4 Entwicklung einer Text-To-Speech-Applikation <strong>und</strong> dynamischer<br />

Bewertungsverfahren<br />

Dieses Projekt ist seit Mai 2004 unser Anteil an einem AiF-geförderten Vorhaben mit dem Thema<br />

„Entwicklung eines Selbstlernsystems mit Mehrkanal-Rückkopplung für das Training der deutschen<br />

Aussprache“ (kurz AZAR = Apparat zur Akzentreduzierung), an dem insgesamt die Partner Gesellschaft<br />

für Wissens- <strong>und</strong> Technologietransfer der TUD, voiceINTERconnect GmbH <strong>Dresden</strong> <strong>und</strong> REZO<br />

Computerservice GmbH & Co. KG <strong>Dresden</strong> beteiligt sind. Ziel des Projektes ist die Entwicklung eines<br />

multimedialen Sprachtrainers zum Erlernen der deutschen Aussprache. Für die Entwicklung komplexer<br />

Feedback-Funktionen werden Verfahren der Spracherkennung <strong>und</strong> der Sprachsynthese eingesetzt,<br />

die das dynamische Detektieren akzentbedingter Abweichungen von der Standardlautung ermöglichen.<br />

Zusätzlich zur akustischen Ein- <strong>und</strong> Ausgabe sind visuelle Feedbackfunktionen (graphische<br />

Ausgabe akustischer Parameter, Darstellung der artikulatorischen Abläufe in sagittaler Projektion<br />

durch Animationssequenzen, Darstellung der Lippenartikulation) vorgesehen. Die Komplexität der<br />

Aufgabenstellung resultiert aus der Zusammenführung von Verfahren der akustischen Sprachsignalanalyse<br />

<strong>und</strong> der Modellierung artikulatorischer Abläufe in einem interaktiven System. Im Rahmen des<br />

Projektes wird der Versuch unternommen, das artikulatorische Modell aus einem Code zu generieren,<br />

der sich direkt auf das akustische Sprachsignal bezieht.<br />

Entsprechend der in den Arbeitspaketen festgelegten Aufgabenverteilung wurden im angegebenen<br />

Zeitraum die wesentlichen Arbeiten zur Gewinnung <strong>und</strong> Aufbereitung der Datenbasis abgeschlossen<br />

sowie linguistische Untersuchungen der gewonnenen Daten durchgeführt. Zunächst wurden phonetisch<br />

ausgewogene Textkorpora zur Erhebung der Leseaussprache (Testsätze, Wortformen, Wortgruppen,<br />

Lesetexte) sowie Aufgaben (Sprechimpulse) für die Erhebung spontansprachlicher Fertigkei-<br />

45


Forschung<br />

ten erstellt. Die Textkorpora wurden phonemisch in SAMPA transkribiert. Nach Probeaufnahmen mit<br />

zwei Probanden im Mai 2004 erfolgte die Optimierung der Textbasis. Durch individuelles Coaching<br />

wurden 10 erwachsene Lerner unterschiedlicher Niveaustufen (Migranten aus dem ostslawischen<br />

Raum) auf die Tests vorbereitet. Für die Erhebung der muttersprachlichen Referenzdaten, die für die<br />

Entwicklung von Spracherkennungssoftware unerlässlich sind, wurde eine phonetisch ausgewogene<br />

Textbasis in russischer Sprache erstellt. Im Juli wurden Audioaufnahmen durchgeführt, die als Ausgangsbasis<br />

für das Annotieren der Sprachdaten dienten. Die manuell segmentierten <strong>und</strong> kanonisch<br />

gelabelten Sprachdaten werden linguistisch analysiert <strong>und</strong> statistisch ausgewertet. Im Ergebnis der<br />

statistischen Auswertung werden die Schwellwerte akustischer Parameter für die Unterscheidung der<br />

Akzentaussprache von akzentfreien Realisationen bestimmt.<br />

Im Oktober 2004 wurden mit 8 Lernenden aus Osteuropa <strong>und</strong> 10 muttersprachlichen deutschen Sprechern<br />

die Korpusdaten in vollem Umfang aufgezeichnet. Die akustischen Aufzeichnungen wurden<br />

dabei mit Videoaufnahmen der Lippenartikulation synchronisiert. Im Ergebnis der linguistischvergleichenden<br />

Untersuchung der gewonnenen Sprachdaten ist eine maschinenlesbare Notation für<br />

die akzentbedingten Abweichungen entstanden. Es handelt sich hierbei um eine Hybrid-Notation aus<br />

den SAMPA-Zeichensätzen für Standarddeutsch <strong>und</strong> die russische Literatursprache. Damit wurde<br />

eine wesentliche Voraussetzung für die Entwicklung akustischer Feedback-Funktionen geschaffen.<br />

Die gegenwärtig laufenden phonetischen Analysen verfolgen das Ziel, akzentrelevante realisationsphonetische<br />

Merkmale zu ermitteln, die im Selbstlernsystem automatisch extrahiert werden sollen.<br />

3.2.5 Sprachsteuerung eines Computerspiels<br />

Die Spracherkennung <strong>und</strong> Sprachsynthese haben trotz langjähriger intensiver Forschung vergleichsweise<br />

wenig praktischen Einsatz erfahren. Die Gründe dafür sind an unterschiedlichen Stellen zu suchen.<br />

Einerseits sind Akzeptanzprobleme zu nennen, da die synthetische Sprache je nach Ressourceneinsatz<br />

deutlich schlechter als die natürliche Sprache ist <strong>und</strong> die Spracherkennung mit einer gewissen<br />

Fehlerrate verb<strong>und</strong>en ist. Des Weiteren setzt sich die Sprachtechnologie gegenüber etablierten<br />

Methoden des Dialoges nicht durch, wenn die Vorteile der neuen Dialogführung nicht überwiegen.<br />

Zu guter Letzt muss diese Problematik auch aus der Position der Anwendung betrachtet werden, da<br />

sich nicht automatisch jedes Medium zur Dialogführung eignet. In einer <strong>Diplom</strong>arbeit wurde anhand<br />

eines Computerspiels der Einsatz von Sprachtechnologie untersucht <strong>und</strong> anhand von Nutzerbefragungen<br />

evaluiert. Dabei wurden besonders ergonomische Kriterien beachtet. Die Ergebnisse dieser<br />

Arbeit lassen sich wie folgt zusammenfassen:<br />

1. Die Spracheingabe erfordert, ebenso wie die Mausbedienung, eine Lernphase. Dabei ist in beiden<br />

Fällen eine Adaption des Menschen auf das jeweilige System zu beobachten.<br />

2. Die Verwendung von Spracheingabe vereinfacht durch ihre Vielseitigkeit das Dialogmodell der<br />

Anwendung.<br />

3. Sprachbedienung ist gr<strong>und</strong>sätzlich langsamer als die Bedienung mit der Maus. Damit die Sprachbedienung<br />

der Mausbedienung vorgezogen wird, muss dieser Nachteil durch andere Vorzüge<br />

ausgeglichen werden.<br />

4. Die Sprachsynthese ist nicht auf einem Stand, wo sie mit natürlicher Sprache vergleichbar ist. Die<br />

Anwendung als Zusatz zur Textausgabe auf dem Bildschirm wird jedoch akzeptiert.<br />

5. Konfidenzmaße bei der Spracherkennung ermöglichen eine Bewertung der Qualität der Erkennung.<br />

Sie müssen jedoch bei jedem Einsatzfall auf ihre Eignung überprüft werden.<br />

6. Die Eignung einer Anwendung für die Bedienung mit natürlicher Sprache ist nicht automatisch<br />

gegeben, sondern muss untersucht werden. Die Sprache ist u. U. nicht oder nur in Verbindung mit<br />

anderen Eingabeformen (z. B. Haptik) einsetzbar.<br />

7. Die Bewertung der Ergonomie ist abhängig von den Anforderungen an den Benutzer, das System<br />

<strong>und</strong> die Anwendung. Generelle Aussagen über die ergonomischen Eigenschaften sind deshalb<br />

nur sehr allgemein möglich, die Untersuchung muss vielmehr für jeden Anwendungsfall gesondert<br />

durchgeführt werden.<br />

Literatur: D. Sobe, M. Eichner, “Sprachsteuerung eines Computerspiels- Untersuchungen zur Leistungsfähigkeit<br />

<strong>und</strong> Ergonomie”,15. Konferenz ESSV = Studientexte zur Sprachkommunikation Bd. 30,<br />

S. 292-299.<br />

46


Forschung<br />

3.2.6 Historische phonetische Geräte<br />

Wie in früheren Jahresberichten bereits angekündigt wurde, besteht das Ziel, die <strong>Dresden</strong>er Sammlung<br />

historischer phonetischer Geräte durch eine ausführliche Web-Präsentation zu erschließen. Im<br />

Berichtsjahr wurde durch die Herren Prof. Mehnert <strong>und</strong> Dr. Dietzel daran zielstrebig weitergearbeitet.<br />

Es liegen jetzt digitalisierte Bilder vollzählig vor, die Schritt für Schritt durch kurze Beschreibungen der<br />

Exponate ergänzt werden.<br />

Auch bei der Instandsetzung <strong>und</strong> Präsentation der Geräte konnten Fortschritte erzielt werden. Abbildung<br />

29 zeigt ein Beispiel. Durch die Präsentation der Ergebnisse auf geeigneten Veranstaltungen<br />

konnten Kontakte geknüpft werden, die zeigen, dass ein deutliches Interesse an der Aufarbeitung <strong>und</strong><br />

Sicherung der Zeugnisse der Vergangenheit unseres Fachgebietes besteht. Zu erwähnen wäre dabei<br />

besonders der Budapester Workshop zum 200. Todestag von Wolfgang von Kempelen.<br />

Abbildung 29: Restaurierung eines Kymographen mit Ausrüstung für die Gr<strong>und</strong>frequenzmessung.<br />

Links: Vorbild für die Rekonstruktion (Panconcelli-Calzia: Das Hamburger experimentalphonetische<br />

Praktikum, I. Teil, 1922). Rechts: Die rekonstruierte Anordnung aus Universal-Kymograph, Kehltonschreiber,<br />

Chronograph <strong>und</strong> Universalstativ. Foto: R. Dietzel.<br />

47


Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />

4 Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />

4.1 Drittmittelprojekte<br />

Verbrennungslärm: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern<br />

2002 – 2005<br />

DFG-Forschergruppe „Verbrennungslärm“, Teilprojekt 4 (KO1242/10-1, /10-2)<br />

Projektleiter: Prof. Dr. P. Költzsch, Prof. Dr. M. Ochmann<br />

Bearbeiter: Dipl.-Ing. H. Brick, Dr. R. Piscoya<br />

Schallquellenmodellierung mittels stochastischer Geschwindigkeitsschwankungen <strong>und</strong><br />

Oberflächendruckfelder<br />

2001-2004<br />

DFG-Projekt (KO 1242/6-3, /6-4)<br />

DFG/BMBF-Verb<strong>und</strong>projekt: 4 <strong>Universität</strong>en, DLR Braunschweig<br />

Projektleiter: Prof. Dr. P. Költzsch<br />

Bearbeiter: Dipl.-Ing. M. Bauer, Dipl.-Ing. A. Zeibig, Dr. A. Borisyuk, Dipl.-Ing. D. Richter<br />

Experimentelle Untersuchungen zur Validierung von aeroakustischen Quellgrößen <strong>und</strong> CAA-<br />

Rechnungen<br />

2001-2004<br />

Auftraggeber: DLR, Deutsches Zentrum für Luft- <strong>und</strong> Raumfahrt, Institut für Aerodynamik <strong>und</strong> Strömungstechnik,<br />

Braunschweig<br />

Projektleiter: Prof. Dr. P. Költzsch<br />

Bearbeiter: Dipl.-Ing. A. Zeibig<br />

Akustische Simulationsverfahren: Vorausberechnung von Strömungs- <strong>und</strong> Körperschall bei<br />

typischen Fahrzeugstrukturen mit dem Ziel der Lärmminderungsprognose<br />

Forschungsverb<strong>und</strong> „Leiser Verkehr“ (DLR, EADS München, TU <strong>Dresden</strong>)<br />

2001-2004<br />

Koordinator <strong>und</strong> Teilprojektleiter Strömungsschall: Prof. Dr. P. Költzsch<br />

Teilprojektleiter Körperschall: Dr. E. Sarradj<br />

Bearbeiter: Dr. E. Sarradj, Dipl.-Ing. B. Knöfel, Dr. A. Borisyuk, FhI IS <strong>Dresden</strong>,<br />

AFD <strong>Dresden</strong><br />

Entwicklung <strong>und</strong> Testung neuer lärmabsorbierender Werkstoffe auf der Basis metallischer<br />

Hohlkugelstrukturen<br />

2002-2004<br />

Auftraggeber: Fraunhofer-Gesellschaft, Institut für Angewandte Materialforschung (IFAM)<br />

Projektleiter: Prof. Dr. P. Költzsch<br />

Bearbeiter: Dipl.-Ing. J. Hübelt, Dr. E. Sarradj<br />

Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur lärmoptimalen<br />

Gestaltung der Bauteile von Verkehrsmitteln<br />

2004<br />

Projektförderung durch die Friedrich-<strong>und</strong>-Elisabeth-BOYSEN-Stiftung<br />

Projektleiter: Prof. Dr. P. Költzsch<br />

Bearbeiter: Dipl.-Ing. A. Witing, Dr. V. Bormann, Student M. W. Kettlitz, Dipl.-Ing. A. Zeibig, Dipl.-Ing.<br />

M. Bauer<br />

DFG-Sonderforschungsbereich 639 „Textilverstärkte Verb<strong>und</strong>komponenten für funktionsintegrierende<br />

Mischbauweisen bei komplexen Leichtbauanwendungen“<br />

Teilprojekt D3: Integrierte Sensornetzwerke<br />

2004-2007<br />

Projektlieter des <strong>IAS</strong>: Prof. Dr. G. Pfeifer<br />

Bearbeiter: Dipl.-Ing. S. Folprecht, Dipl.-Ing. E. Starke,<br />

Dipl.-Ing. J. Landgraf<br />

48


Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />

Ultraschallwandler für gerichtete Audioabstrahlung<br />

1999 - 2004<br />

Auftraggeber: Sennheiser electronic GmbH<br />

Bearbeiter: Prof. Dr. G. Pfeifer<br />

Mikrofon mit weitgehend frequenzunabhängiger Richtcharakteristik<br />

Auftraggeber: Microtech Gefell<br />

2003-2004<br />

Bearbeiter: Dipl.-Ing. D. Richter<br />

Bestimmung von Kenngrößen eines Telefonhörers<br />

Auftraggeber: Kommunikationstechnik PRAGMA Zittau<br />

2004<br />

Bearbeiter: Dr. G. Fuder<br />

Integration von Spracherkennung <strong>und</strong> –synthese unter Verwendung gemeinsamer Datenbasen<br />

2001 – 2005<br />

DFG-Projekt HO 1674/7<br />

Projektleiter: Prof. Dr. R. Hoffmann<br />

Bearbeiter: Dipl.-Ing. M. Cuevas, T. Oba, M.A.<br />

Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung technischer Prozesse basierend<br />

auf spektralen Repräsentationen akustischer Vorgänge<br />

2004 – 2005<br />

DFG-Projekt HO 1674/8-1<br />

Gemeinschaftsprojekt mit Fraunhofer Institut für zerstörungsfreie Prüfverfahren, Außenstelle <strong>Dresden</strong><br />

Projektleiter IZFP: Dr.-Ing. D. Hentschel<br />

Projektleiter TUD: Prof. Dr. R. Hoffmann<br />

Bearbeiter: Dipl.-Inf. C. Tschöpe, Dipl.-Ing. S. Werner<br />

Nichtinvasive Blutdruckmessung am aktiven Menschen<br />

2004 – 2005<br />

Ges<strong>und</strong>heitstechnik Stier, Neuruppin<br />

Projektleiter: Prof. Dr. R. Hoffmann<br />

Bearbeiter: Dr. U. Kordon, Dipl.-Ing. H. Hussein<br />

Industrielle Anwendungen der technischen Sprachkommunikation<br />

2004<br />

Gesellschaft für Wissens- <strong>und</strong> Technologietransfer der TU <strong>Dresden</strong> mbH,<br />

Servicebereich „Signalverarbeitung <strong>und</strong> Mustererkennung“<br />

Hauptanwender im Berichtsjahr: Siemens AG<br />

Projektleiter: Prof. Dr. R. Hoffmann, Dr. U. Kordon, Dipl.-Ing. O. Jokisch<br />

Erstellung einer Sprachdatenbank für Sprachsynthese <strong>und</strong> Sprachkonversion<br />

2004 - 2005<br />

Siemens CT München, Unterauftrag im EU-Projekt TC-STAR<br />

Projektleiter: Prof. Dr. R. Hoffmann<br />

Entwicklung einer Text-to-Speech-Applikation <strong>und</strong> dynamischer Bewertungsverfahren<br />

für ein Selbstlernsystem für die deutsche Aussprache (AZAR)<br />

2004 – 2006<br />

Zuwendung des BMBF im Rahmen des Programmes PRO INNO an die<br />

Gesellschaft für Wissens- <strong>und</strong> Technologietransfer der TU <strong>Dresden</strong> mbH<br />

Bearbeiter: Dipl.-Slaw. R. Jäckel, Dipl.-Ing. M. Lachmann<br />

Projektpartner: voiceINTERconnect GmbH <strong>Dresden</strong>, REZO Computer-Service <strong>Dresden</strong><br />

Zweisprachiges Sprachsynthesesystem deutsch-tschechisch<br />

2004 – 2007<br />

DAAD-Programm Ostpartnerschaften<br />

Kooperation mit Karls-<strong>Universität</strong> Prag <strong>und</strong> TU Prag<br />

Bearbeiter TUD: Dr. U. Kordon<br />

49


Drittmittelprojekte <strong>und</strong> haushaltfinanzierte Forschung<br />

4.2 Haushaltfinanzierte Forschungsaufgaben<br />

Ultraschallsicherheit diagnostischer Geräte<br />

Schallfeldmodellierungen – Suche nach „hot spots“, Schallabsorption <strong>und</strong> –streuung, Wärmeleitung in<br />

festen <strong>und</strong> fluiden Medien<br />

2001 – 2004<br />

Doz. Dr. E. Kühnicke<br />

Ultraschallbildgewinnung<br />

Einsatz <strong>und</strong> Bildverarbeitung für 3D-US-Daten, Modellierung des US-Aufnahmeprozesses<br />

2002-2004<br />

Doz. Dr. E. Kühnicke<br />

Dresdner Sprachsynthesesystem DRESS / microDRESS<br />

2004<br />

Prof. Dr. R. Hoffmann, Dr. H. Ding, Dipl.-Ing. O. Jokisch,<br />

Dr. U. Kordon, Dipl.-Ing. H. Kruschke, Dipl.-Ing. G. Strecha u. a.<br />

Hochwertiges Diphoninventar für die deutsche Sprachsynthese<br />

2002 – 2005<br />

Kooperation mit Prof. Dr. U. Hirschfeld, MLU Halle/Saale<br />

Prof. Dr. R. Hoffmann, Dipl.-Ing. O. Jokisch, Dr. H. Ding,<br />

Dipl.-Ing. M. Lachmann, Dipl.-Ing. D. Sobe<br />

Web-basierter Sprachserver<br />

2004<br />

Nachfolgearbeiten zum BMBF-Verb<strong>und</strong>projekt eL-IT (2001 – 2003)<br />

Dipl.-Ing. M. Eichner, Dipl.-Ing. D. Sobe, Dr.-Ing. M. Wolff<br />

Stimmaktivierung unter Nutzung prosodischer Merkmale<br />

2004<br />

Dipl.-Ing. M. Eichner, Dipl.-Wi.-Ing. M. Kühne, Dr.-Ing. M. Wolff<br />

Historische phonetische Geräte<br />

ab 2002<br />

Prof. Dr. D. Mehnert, Dr. R. Dietzel<br />

50


5 Veröffentlichungen<br />

Veröffentlichungen<br />

5.1 Bücher, Buchbeiträge<br />

[1] DELFS, J. <strong>und</strong> KÖLTZSCH, P. (Herausgeber): Vortragsband (CD/Webseite des DLR) zur<br />

Sitzung des DGLR-Fachausschusses T 2.3 „Strömungsakustik/Fluglärm“, 30.01.2004, DLR<br />

Braunschweig/TU <strong>Dresden</strong>.<br />

[2] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Sprachtechnologien in eL-IT: Einsatzszenarien<br />

<strong>und</strong> Umsetzung. In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen:<br />

Skaker Verlag 2004, ISBN 3-8322-2531-5, 111 – 120.<br />

[3] HOFFMANN, R.; KORDON, U.; KÜRBIS, S.; LACHMANN, M.: Signalverarbeitung <strong>und</strong> ihre<br />

Anwendung in der Akustik: Die Module „Signalverarbeitung“ <strong>und</strong> „Elektro- <strong>und</strong> Psychoakustik“.<br />

In: FELLBAUM, K.; GÖCKS, M (Hrsg.), eLearning an der Hochschule. Aachen: Shaker Verlag<br />

2004, ISBN 3-8322-2531-5, 69 – 78.<br />

[4] LESCHKA, S.; PFEIFER, G.: Ultraschallwandler mit PVDF-Folien - ein Berechnungsansatz<br />

mit Netzwerkmethoden. In: Schriftenreihe AHMT, XVII. Messtechnisches Symposium Freiburg<br />

2004. Shaker Verlag, Aachen 2004 ISBN: 3-8322-3190-0.<br />

[5] PETRICK, R.; HIRSCHFELD, D.; RICHTER, T. (VIC <strong>Dresden</strong>); HOFFMANN, R.: Verbkey – A<br />

single-chip speech control for the automobile environment. In: ABUT, H.; HANSEN, J. H. L.;<br />

TELEDA, K (Eds.), DSP for In-Vehicle and Mobile Systems. Springer eBook available at<br />

Kluwer Online, ISBN 0-387-22979-5.<br />

[6] SCHRÖDER, W. (Herausgeber): Fourth Aeroacoustics Workshop SWING (Simulation of wingflow<br />

noise generation). Co-organized by: RWTH Aachen – Aerodynamisches Institut / TU<br />

<strong>Dresden</strong> – Institut für Akustik <strong>und</strong> Sprachkommunikation (P. Költzsch, A. Zeibig). 26. – 27.<br />

Februar 2004, Aachen. Vortragsband Aachen/<strong>Dresden</strong> 2004, 154 Seiten.<br />

[7] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. <strong>Dresden</strong>: w.e.b. <strong>Universität</strong>sverlag<br />

2004 = Studientexte zur Sprachkommunikation; 32. ISBN 3-937672-71-0.<br />

5.2 Veröffentlichungen in Zeitschriften<br />

[8] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; KÜHNE, M.; WOLFF, M.:<br />

Speech-enabled services in a web-based e-learning environment. Advanced Technology for<br />

Learning 1 (2004) 2, 91 – 98.<br />

[9] FELDMANN, U.; BHATTACHARYA, J. (ÖAW Wien): Predictability improvement as an<br />

asymmetrical measure of interdependence in bivariate time series. International Journal of<br />

Bifurcation and Chaos 14 (2004) 2, 505 – 514.<br />

[10] HUEBELT, J.; KOSTMANN, C.; KOELTZSCH, P., STEPHANI, G.: Schallabsorber aus metallischen<br />

Hohlkugelstrukturen. In: Internationale Messe für Fertigungstechnik <strong>und</strong> Automatisierung,<br />

METAV München, 27.04. - 30.04.2004.<br />

[11] WERNER, S.; EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Towards spontaneous speech<br />

synthesis – Utilizing language model information in TTS. IEEE Trans. on Speech and Audio<br />

Processing 12 (2004) 4, 436 – 445.<br />

[12] ZEIBIG, A., BAUER, M.: Aerodynamische <strong>und</strong> aeroakustische Messungen am Windkanal zur<br />

Validierung numerischer Simulationen. Vortrag DGLR Fachausschusssitzung Strömungsakustik/Fluglärm,<br />

30.01.2004, DLR Braunschweig, Vortragsband, CD.<br />

5.3 TU-Informationen <strong>und</strong> Lehrmaterial<br />

[13] KORDON, U.: <strong>Technische</strong> Sprachkommunikation. Folienskript zur Vorlesung, TU <strong>Dresden</strong>,<br />

April 2004, 66 Seiten.<br />

[14] KORDON, U.: Sprachsynthese. Folienskript zur Vorlesung, TU <strong>Dresden</strong>, Oktober 2004, 50<br />

Seiten.<br />

[15] HOFFMANN, R.: Speech, Text, and Braille Conversion Technology. Preprint, TU <strong>Dresden</strong>,<br />

August 2004, 71 S.<br />

51


Veröffentlichungen<br />

5.4 Vortragsveröffentlichungen<br />

[16] BAUER, M.: Applicability of the SNGR model to compute Trailing Edge Noise. Proceedings of<br />

the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France, pp. 129 – 130.<br />

[17] BAUER, M.; ZEIBIG, A.: Applicability of the Modified von Kármán Spectrum to Predict<br />

Broadband Trailing Edge Noise. Tagungsband 14. DGLR/STAB Symposium, November 2004<br />

(Veröffentlichung durch den Springer Verlag im Jahr 2005 vorgesehen).<br />

[18] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P.: Modelling of combustion noise<br />

with the Bo<strong>und</strong>ary Element Method and Equivalent Source Method. Proceedings of Internoise<br />

2004, August 22– 25, Prague, Czech Republic 2004.<br />

[19] DING, H.; JOKISCH, O.: Grapheme-to-phoneme conversion in Mandarin Chinese text-tospeech.<br />

Proceedings of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg,<br />

France, 1151 – 1152.<br />

[20] DING, H.; JOKISCH, O.; HOFFMANN, R.: Glottalization in inventory construction: A crosslanguage<br />

study. Proc. Intern. Symposium on Chinese Spoken Language Processing<br />

(ISCSLP), December 15 – 18, Hong Kong, 37 – 40.<br />

[21] EICHNER, M.; GÖCKS, M. (BTU Cottbus); HOFFMANN, R.; WOLFF, M.: Speech enabled<br />

services in a web-based e-learning environment. Proc. of the <strong>IAS</strong>TED International<br />

Conference on Web-Based Education, February 16 – 18, 2004, Innsbruck, Austria, 157 – 162.<br />

[22] EICHNER, M.; WOLFF, M.; HOFFMANN, R.: Voice characteristics conversion for TTS using<br />

reverse VTLN. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP),<br />

May 17 – 21, Montreal, Canada, I-17 – I-20.<br />

[23] EWERT, R.; BAUER, M.: Towards the Prediction of Trailing Edge Noise via Stochastic<br />

Surface Sources. AIAA-Paper 2004-2861, American Institute for Aeronautics and<br />

Astronautics, 2004.<br />

[24] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; HIRSCHFELD, D. (VIC <strong>Dresden</strong>): Advances<br />

in speech technology for embedded systems. Conference and Workshop on Assistive<br />

Technologies for Vision and Hearing Impairment (CVHI), June 29 – July 2, 2004, Granada,<br />

Spain, Abstracts p. 30 / Proceedings (CD-ROM).<br />

[25] HOFFMANN, R.; JOKISCH, O.; KORDON, U.; STRECHA, G.: Progress in scalable speech<br />

synthesis. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15,<br />

2004, Prague, 9 – 10.<br />

[26] HOFFMANN, R.; JOKISCH, O.; HIRSCHFELD, U. (MLU Halle); Anders, L. C. (MLU Halle):<br />

LexDRESS – Speech synthesis for a speaking pronunciation dictionary – First results. In:<br />

FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz,<br />

20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30,<br />

183 – 190.<br />

[27] HOFFMANN, R.; JOKISCH, O.; STRECHA, G.; VOLK, T.; HAIN, H.-U. (Siemens CT);<br />

FINGSCHEIDT, T.; AALBURG, S.; STAN, S. (Siemens ICM): Sprachsynthese mit minimiertem<br />

Footprint für Embedded-Anwendungen. VDE-Kongress „Innovationen für Menschen“, 18.<br />

– 20. Oktober 2004, Berlin, Band 1: Fachtagungsberichte der ITG / ETG. Berlin / Offenbach:<br />

VDE Verlag 2004, 187 – 192.<br />

[28] HOFFMANN, R.; MEHNERT, D.: Measuring pitch with historic phonetic devices. Proceedings<br />

of the Joint Congress CFA / DAGA ’04, March 22 – 25, Strasbourg, France, 1147 – 1148.<br />

[29] HOFFMANN, R.; SHPILEWSKY, E. (Univ. Bialystok); LOBANOV, B. (Academy of Sciences<br />

Minsk); RONZHIN, A. (Inst. f. Informatics and Automation, St. Petersburg): Development of<br />

multi-voice and multi-language Text-to-Speech and Speech-to-Text conversion system<br />

(languages: Belorussian, Polish, Russian). Proc. of the 9 th Intern. Conf. “Speech and<br />

Computer” (SPECOM), Sep. 20 – 22, 2004, St. Petersburg, 657 – 661.<br />

[30] HOLSTEIN, P.; KOCH, M. (SINUS Messtechnik); HIRSCHFELD, D. (VIC <strong>Dresden</strong>);<br />

HOFFMANN, R.; BADER, D.; AUGSBURG, K. (TU Ilmenau): A strategy for signal recognition<br />

<strong>und</strong>er adverse conditions. Proc. Internoise, August 25 – 28, 2003, Jeju, Korea, N-111 [Nachtrag<br />

zu Jahresbericht 2003].<br />

52


Veröffentlichungen<br />

[31] HUEBELT, J.; ZEIBIG, A.; KOSTMANN, C.; STEPHANI, G.: Parameter of metallic hollow<br />

spheres - a porous so<strong>und</strong> absorbing material. Proceedings of 18 th International Congress on<br />

Acoustics, Japan, April 4 until 9 2004, Kyoto.<br />

[32] JOKISCH, O.; HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung für<br />

Sprachsynthese. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband<br />

der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation<br />

Bd. 30, 175 – 182.<br />

[33] JOKISCH, O.; HOFMANN, M.: Evolutionary optimization of an adaptive prosody model. Proc.<br />

8 th International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004),<br />

October 4 – 8, 2004, Jeju Island, Korea, TuC201p.18.<br />

[34] KNÖFEL, B. <strong>und</strong> SARRADJ, E.: Structure-borne So<strong>und</strong> in Automotive Structures: High<br />

Frequency Bo<strong>und</strong>ary Element Method (HFBEM) vs. Statistical Energy Analysis (SEA).<br />

Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg,<br />

France“, Vortragsband, CD, S.13-14.<br />

[35] KNÖFEL, B. <strong>und</strong> SARRADJ, E.: An Alternative Method To Compute High Frequency Structure<br />

Borne So<strong>und</strong> In Automotive Structures. Proceedings of the 11 th International Congress on<br />

So<strong>und</strong> and Vibration, July 05 - 08 2004, St. Petersburg, Russia, S. 3257-3264.<br />

[36] KÖLTZSCH, P. <strong>und</strong> V. BORMANN: Überlegungen zur Optimierung mit subjektiven Zielfunktionen<br />

(mit Beispielen aus der Akustik). Proceedings of the Joint Congress CFA/DAGA 2004,<br />

22. – 25. März 2004, Strasbourg, France.<br />

[37] KÖLTZSCH, P.; BAUER, M.; WITING, A.; ZEIBIG, A.; KETTLITZ, M. W.: Beitrag zur Modellierung<br />

von Strömungsschallquellen mit akustischen Elementarstrahlern. Vortrag, Deutscher<br />

Luft- <strong>und</strong> Raumfahrtkongress, <strong>Dresden</strong>, 2004, Kongressband + CD.<br />

[38] KÖLTZSCH, P.: Werner Albring <strong>und</strong> die Ähnlichkeitsmechanik. Vortrag zum Ehrenkolloquium<br />

anlässlich des 90. Geburtstages von Prof. em. Dr.-Ing. h.c. mult. Werner Albring, Berlin-<br />

Brandenburgische Akademie der Wissenschaften, 28. September 2004, Kolloquiumsband.<br />

[39] KÖLTZSCH, P.: Einführung in die Strömungsakustik. Vortrag zum Lehrgang „Strömungsinduzierter<br />

Lärm“, 12. - 14. Oktober 2004, <strong>Universität</strong> Erlangen-Nürnberg. Vortragsband S. 1 -19.<br />

[40] KÖLTZSCH, P.: <strong>Technische</strong> Akustik/Strömungsakustik – ausgewählte Gr<strong>und</strong>lagen. Vortrag<br />

zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen,<br />

23. – 24. November 2004, Vortragsmappe S. 1 – 18.<br />

[41] KÖLTZSCH, P.: Geräuscherzeugung durch Strömungen – Gr<strong>und</strong>lagen <strong>und</strong> Überblick. Vortrag<br />

zur Tagung „Aeroakustik“, Kongresshotel Stuttgart, veranstaltet vom Haus der Technik Essen,<br />

23. – 24. November 2004, Vortragsmappe, S. 1 – 41.<br />

[42] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic<br />

features. Proc. 14th Czech-German Workshop Speech Processing, September 13 – 15, 2004,<br />

Prague, p. 11.<br />

[43] KÜHNE, M.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Voice activation using prosodic<br />

features. Proc. 8 th International Conference on Spoken Language Processing (ICSLP,<br />

INTERSPEECH 2004), October 4 – 8, 2004, Jeju Island, Korea, FrB202p.9.<br />

[44] KÜHNICKE, E.: GREEN’S functions for complex bo<strong>und</strong>ary conditons. Proc. of the 18th International<br />

Congress on Acoustics, April 4 – 9, Kyoto, Japan, pp. II-997 - II-982.<br />

[45] Putz, A.; Kühnicke, E.: Simulationsbasierte Optimierung eines Ultraschallmessverfahrens zur<br />

Bewertung der Montagequalität armierter Werkzeuge für die Kaltmassivumformung, DACH-<br />

Jahrestagung der DGZfP, Berichtsband 89-CD, Salzburg 17.-19. Mai 2004.<br />

[46] OBA, T.: Regional diversity of German intonation. Proc. 14th Czech-German Workshop<br />

Speech Processing, September 13 – 15, 2004, Prague, p2 – 15.<br />

[47] PISCOYA, R., OCHMANN, M., BRICK, H., KÖLTZSCH, P.: Modelling of the combustion noise<br />

by means of the equivalent source method (ESM). Proceedings of the Joint Congress<br />

CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France.<br />

53


Veröffentlichungen<br />

[48] SARRADJ, E.; SCHULZE, C.; ZEIBIG, A.: Mikrofonarray mit Nahfeld-Beamforming. 6. Internationale<br />

Wissenschaftliche Konferenz „Saterra“, Tagungsband, 12. November 2004, HTW Mittweida.<br />

[49] SCHULZE, C.; ZEIBIG, A.; RICHTER, D.: Basic Investigations of Microphone Arrays.<br />

Proceedings of the Joint Congress CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg,<br />

France.<br />

[50] SCHULZE, C.; SARRADJ, E.; ZEIBIG, A.: Characteristics of microphone arrays. Proceedings<br />

of Internoise 2004, August 22 – 25, Prague, Czech Republic.<br />

[51] SCHNELL, M.: Verstärkungslernen zur Prosodievorhersage in einem Sprachproduktionssystem.<br />

In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der<br />

15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation<br />

Bd. 30, 140 – 147.<br />

[52] SCHNELL, M.; HOFFMANN, R.: What concept-to-speech can gain for prosody. Proc. 8 th<br />

International Conference on Spoken Language Processing (ICSLP, INTERSPEECH 2004),<br />

October 4 – 8, 2004, Jeju Island, Korea, FrA1402o.6.<br />

[53] SOBE, D.: Investigating capabilities and ergonomic properties of a speech controlled<br />

computer game. Proc. 14th Czech-German Workshop Speech Processing, September 13 –<br />

15, 2004, Prague, p. 16.<br />

[54] SOBE, D.; EICHNER, M.: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit<br />

<strong>und</strong> Ergonomie. In: FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung.<br />

Tagungsband der 15. Konferenz, 20. – 22. September 2004, Cottbus = Studientexte<br />

zur Sprachkommunikation Bd. 30, 292 – 299.<br />

[55] STRECHA, G.; JOKISCH, O.; HOFFMANN, R.: A resource-saving modification of TD-PSOLA.<br />

Advances in Speech Technology. International Workshop, July 3 – 4, 2003, Maribor, 151 –<br />

155 [erschienen 2004].<br />

[56] STRECHA, G.: Neue Ansätze zur Sprachsynthese mit kodierten Sprachsegmenten. In:<br />

FELLBAUM, K. (Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz,<br />

20. – 22. September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30,<br />

156 – 162.<br />

[57] TSCHÖPE, C.; HENTSCHEL, D. (FhG <strong>Dresden</strong>); WOLFF, M.; EICHNER, M.; HOFFMANN,<br />

R.: Classification of non-speech acoustic signals using structure models. Proc. IEEE Int. Conf.<br />

on Acoustics, Speech, and Signal Processing (ICASSP), May 17 – 21, Montreal, Canada, V-<br />

653 – V-656.<br />

[58] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Integrating speech enabled<br />

services in a web-based e-learning environment. Int. Conf. on Information Technology (ITCC),<br />

April 5 – 7, 2004, Las Vegas, USA, vol. 2, 303 – 307.<br />

[59] WERNER, S.; WOLFF, M.; EICHNER, M.; HOFFMANN, R.: Modeling pronunciation variation<br />

for spontaneous speech synthesis. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal<br />

Processing (ICASSP), May 17 – 21, Montreal, Canada, I-673 – I-676.<br />

[60] WOLFF, M.; KÜHNE, M.: Stimmaktivierung eines Spracherkenners. In: FELLBAUM, K.<br />

(Hrsg.), Elektronische Sprachsignalverarbeitung. Tagungsband der 15. Konferenz, 20. – 22.<br />

September 2004, Cottbus = Studientexte zur Sprachkommunikation Bd. 30, 69 – 78.<br />

[61] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Aeroacoustic<br />

Measurements and Validation Regarding Trailing Edge Noise. Proceedings of the 4 th<br />

Aeroacoustic Workshop in connection with the project SWING, February 26 – 27 2004,<br />

Aachen.<br />

[62] ZEIBIG, A.; SCHULZE, C.; HÜBELT, J.: Microphone array measurements for aeroacoustic<br />

investigations using a frequency band filtering method. Proceedings of the Joint Congress<br />

CFA/DAGA 2004, 22. – 25. März 2004, Strasbourg, France.<br />

[63] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.:<br />

Aeroacoustic measurements for the validation of numerical simulations. Proceedings of the<br />

11 th International Congress on So<strong>und</strong> and Vibration, July 05 - 08 2004, St. Petersburg,<br />

Russia.<br />

54


Veröffentlichungen<br />

[64] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; HÜBELT, J.: Microphone array measurements for<br />

aeroacoustic source analysis. Proceedings of the 11 th International Congress on So<strong>und</strong> and<br />

Vibration, July 05 - 08 2004, St. Petersburg, Russia.<br />

[65] ZEIBIG, A.; SCHULZE, C.; SARRADJ, E.; BAUER, M.: Validation of aeroacoustic numerical<br />

simulations with wind tunnel measurements. Proceedings of Internoise 2004, August 22 – 25,<br />

Prague, Czech Republic.<br />

[66] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ: Aeroakustische<br />

Messungen am Windkanal zur Validierung numerischer Simulationen. Vortrag, 6. Internationale<br />

Wissenschaftliche Konferenz SATERRA, 11.-16. November 2004 HTW Mittweida,<br />

Tagungsband.<br />

5.5 Vorträge (ungedruckt)<br />

[67] BAUER, M.: Überblick über Arbeiten mit dem SNGR-Modell (<strong>IAS</strong> & DLR). Vortrag bei Robert<br />

Bosch GmbH, 15.10.04, Stuttgart.<br />

[68] BAUER, M.: Berechnung von Umströmungsgeräuschen mit Hilfe eines synthetischen turbulenten<br />

Geschwindigkeitsfeldes, Vortrag beim Kolloquium der Akustiker des DLR, 22.10.04, TU<br />

Berlin.<br />

[69] BRICK, H.; PISCOYA, R.; OCHMANN, M.; KÖLTZSCH, P: Berechnung von Verbrennungslärm<br />

mit der Bo<strong>und</strong>ary-Elemente- <strong>und</strong> der Ersatzstrahlermethode. 11. Workshop Physikalische<br />

Akustik, Bad Honnef, 17. September 2004 (erscheint demnächst in Acustica/Acta acustica).<br />

[70] DING. H.; JOKISCH, H.: An advanced American diphone inventory from the phonetic-acoustic<br />

viewpoint. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004, Maribor,<br />

Slovenia, Abstracts p. 25 – 26.<br />

[71] FELDMANN, U.: Design and synchronization of inverse systems. COST-277 Non-linear<br />

speech processing – MC meeting & seminar, April 15 – 16, 2004, Limerick, Ireland.<br />

[72] HOFFMANN, R.: Der Weg zur eingebetteten Sprachsynthese. <strong>Universität</strong> Trier, Phonetik-<br />

Workshop, 4. Juni 2004.<br />

[73] HOFFMANN, R.: Kommunikationsakustik. Vortrag im Rat der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik,<br />

21. Juli 2004.<br />

[74] HOFFMANN, R.: Technologische Fortschritte in der Spracherkennung <strong>und</strong> -synthese. T-<br />

Systems, Customer Care Center Circle für Versicherungen, 11. Oktober 2004, Leipzig.<br />

[75] HOFFMANN, R.: Vorstellung der Professur „Sprachkommunikation“. TU <strong>Dresden</strong>, Institut für<br />

Arbeits-, Organisations- <strong>und</strong> Sozialpsychologie, 22. November 2004.<br />

[76] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: State of the art in the project<br />

UASR (Unified approach for speech synthesis and recognition). 11 th Int. Workshop Advances<br />

in Speech Technology, July 7 – 9, 2004, Maribor, Slovenia, Abstracts p. 13 – 14.<br />

[77] HOFFMANN, R.; EICHNER, M.; WERNER, S.; WOLFF, M.: Vorstellung der Professur<br />

„Sprachkommunikation“. Gemeinsame Präsentation mit VIC <strong>Dresden</strong>, München, 24.<br />

November 2004.<br />

[78] JOKISCH, O.; STRECHA, G.; DING, H.: Multilingual speaker selection for creating a speech<br />

synthesis database. 11 th Int. Workshop Advances in Speech Technology, July 7 – 9, 2004,<br />

Maribor, Slovenia, Abstracts p. 17 – 18.<br />

[79] KNÖFEL, B: Ein alternatives Berechnungsverfahren zur Körperschallausbreitung in Fahrzeugstrukturen.<br />

Vortrag zum Institutskolloquium. 12. Mai 2004, Institut für Akustik <strong>und</strong><br />

Sprachkommunikation, TU <strong>Dresden</strong>.<br />

[80] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen.<br />

TU <strong>Dresden</strong>, Institut für Akustik <strong>und</strong> Sprachkommunikation, 7. April 2004.<br />

[81] KÖLTZSCH, P.: Fluglärm – Schallquellen, Belästigungen, Lärmminderung. Vorlesung im Studium<br />

Generale: Ringvorlesung „Interdisziplinäre Aspekte der Luft- <strong>und</strong> Raumfahrt – Das UZLR<br />

stellt sich vor (Universitäres Zentrum für Luft- <strong>und</strong> Raumfahrt)“, 2. November 2004.<br />

55


Veröffentlichungen<br />

[82] KÖLTZSCH, P.: Modelle zum Problemlösen – Lösungen zum Modellproblem. Akademievorlesung<br />

Sommersemester 2004. Berlin-Brandenburgische Akademie der Wissenschaften, Leibnizsaal,<br />

13. Mai 2004.<br />

[83] KÖLTZSCH, P. <strong>und</strong> V. BORMANN: Optimierung mit subjektiven Zielfunktionen. Vortrag zum<br />

3. Workshop der BBAW-Studiengruppe „Strukturbildung <strong>und</strong> Innovation: Transdisziplinäre Aspekte,<br />

Analyse <strong>und</strong> Optimierung“, 11. – 13. März 2004, Berlin.<br />

[84] MEHNERT, D.: Experimentalphonetik in Berlin. <strong>Universität</strong> Trier, Phonetik-Workshop, 4. Juni<br />

2004.<br />

[85] MEHNERT, D.; HOFFMANN, R.; DIETZEL, R.; KORDON, U.: Acoustic experiments with<br />

Wethlo’s larynx model. International Workshop in Phonetics Dedicated to the Memory of<br />

Farkas Kempelen, March 11 – 13, 2004, Budapest, Abstracts p. 31 – 32.<br />

[86] MIXDORFF, H. (TFH Berlin); JOKISCH, O.: Joint international bid for hosting SPEECH<br />

PROSODY in <strong>Dresden</strong>, Germany, in the Spring of 2006. Int. Conf. Speech Prosody, March 23<br />

– 26, Nara, Japan.<br />

[87] PISCOYA, R.: Modellierung der Schallabstrahlung von Flammen mit akustischen Ersatzstrahlern.<br />

Projekttreffen der Forschergruppe „Combustion Noise“, <strong>Universität</strong> Karlsruhe, Engler-<br />

Bunte-Institut, 04. Mai 2004.<br />

[88] PFEIFER, G.: Der Ultraschallstrahler als Richtlautsprecher, Theorie <strong>und</strong> Praxis der Demodulation<br />

in Luft. Öffentlicher Fachvortrag in FH Furtwangen 02.04.2004.<br />

[89] PISCOYA, R. <strong>und</strong> P. KÖLTZSCH: Verbrennungslärm. Vortrag zum Institutskolloquium. 30.<br />

Juni 2004, Institut für Akustik <strong>und</strong> Sprachkommunikation, TU.<br />

[90] ZEIBIG, A.; BAUER, M.; KÖLTZSCH, P.; WITING, A.; SCHULZE, C.; SARRADJ, E.: Validierungen<br />

zum aeroakustischen Quellmechanismus an Flugzeugtragflügeln. Vortrag zum Institutskolloquium.<br />

10. März 2004, Institut für Akustik <strong>und</strong> Sprachkommunikation, TU <strong>Dresden</strong>.<br />

5.6 Patente<br />

[91] HÜBELT, J.; KOSTMAN, C.; STEPHANI, G.; WAAG, U.; LOTZE, G.: Schallabsorber Patentnummer<br />

DE10347226, Anmelder: Fraunhofer-Gesellschaft zur Förderung der angewandten<br />

Forschung e. V, erteilt am 16.12.2004.<br />

[92] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: System zur ortssensitiven Wiedergabe<br />

von Audiosignalen. DE 103 20 274 A1, Offenlegungsschrift vom 9. 12. 2004.<br />

[93] PFEIFER, G.; HOFFMANN, R.; NIEHOFF, W.; MEYER, R.: Audiosignal-Erkennungssystem.<br />

DE 103 20 209 A1, Offenlegungsschrift vom 16. 12. 2004.<br />

5.7 Forschungsberichte<br />

[94] CUEVAS, M.: FSM Language Model Using Katz’ Back-Off Method. Forschungsbericht, TU<br />

<strong>Dresden</strong>, <strong>IAS</strong>, August 2004.<br />

[95] EICHNER, M.; WOLFF, M.: eL-IT – e-Learning-Module für Studiengänge der Informations-,<br />

Kommunikations- <strong>und</strong> Medientechnik. Abschlussbericht zum BMBF-Projekt 08NM136C. TU<br />

<strong>Dresden</strong>, <strong>IAS</strong>, März 2004.<br />

[96] JÄCKEL, R.: Lernsystem für das Training der deutschen Aussprache. Curicukum Phonetik<br />

Teil 1. Forschungsbericht im Kooperationsprojekt AzAR, TU <strong>Dresden</strong>, <strong>IAS</strong>, November 2004<br />

[97] KÖLTZSCH, P.: Messung akustischer Charakteristiken von Modellstrukturen als Beitrag zur<br />

lärmoptimalen Gestaltung der Bauteile von Verkehrsmitteln. Abschlussbericht zum Forschungsprojekt,<br />

gefördert durch die Friedrich-<strong>und</strong>-Elisabeth-Boysen-Stiftung. 11. Oktober<br />

2004.<br />

[98] KORDON, U.; KÜRBIS, S.; WOLFF, M.: Nichtinvasive Blutdruckmessung am aktiven Menschen.<br />

Forschungsbericht (Auftraggeber: Ges<strong>und</strong>heitstechnik Stier), TU <strong>Dresden</strong>, <strong>IAS</strong>, März<br />

2004.<br />

[99] PISCOYA, R.; BRICK, H.; OCHMANN, M.; KÖLTZSCH, P.: Modellierung der Schallabstrahlung<br />

von Flammen mit akustischen Ersatzstrahlern. Forschungsbericht der <strong>Technische</strong>n<br />

Fachhochschule Berlin/TU <strong>Dresden</strong> 2004.<br />

56


Veröffentlichungen<br />

Veröffentlichungen in Zeitungen <strong>und</strong> anderen Medien<br />

[100] HOFFMANN, R.: Pionier der technischen Sprachkommunikation verstorben. Dresdner <strong>Universität</strong>sjournal<br />

15 (2004) Nr. 13, S. 7.<br />

[101] REPKOW, F.: Forschung wider den Lärm. Ausgründung der TUD erforscht die Akustik.<br />

Dresdner <strong>Universität</strong>sjournal 15 (2004) Nr. 13, S. 8.<br />

[102] MAEDER, M. (Regie): Hugo Ball - Tenderenda der Phantast. Hörspielfassung mit synthetischen<br />

Stimmen [u. a. von DRESS]. Komposition <strong>und</strong> Produktion von Marc Matter, Marcus<br />

Maeder <strong>und</strong> Bernd Schurer. Schweizer Radio DRS 2, September 2004.<br />

[103] SCHMALFELDT, P.: Interesse auf der CeBIT. Dresdner <strong>Universität</strong>sjournal 15 (2004) Nr. 6, S.<br />

10.<br />

[104] N. N.: eL-IT – e-Learning-Module für Studiengänge der Informations-, Kommunikations- <strong>und</strong><br />

Medientechnik. Kursbuch eLearning 2004 – Produkte aus dem Förderprogramm. BMBF, Projektträger<br />

Neue Medien in der Bildung, 2004, S. 154 – 157.<br />

[105] N. N.: Forscher auf Abruf. Das Geschäftsmodell der TU <strong>Dresden</strong>. Deutschlandfunk,<br />

29.12.2004, Sendung „Campus <strong>und</strong> Karriere“ www.dradio.de/dlf/sendungen/campus/334665/<br />

[106] N.N.: Die Semperoper - Geschichten vom Wiederaufbau SACHSENSPIEGEL REPORTAGE:<br />

MDR regional, 29.12.2004, 20.15 Uhr,<br />

5.8 Messeteilnahmen<br />

CeBIT<br />

Exponate: Integrierte Sprachtechnologielösungen<br />

Webbasierte Sprachdienste<br />

Hannover, 18. – 24. März 2004<br />

Expo Science Europe (ESE 2004) – European Science Forum of the Youth<br />

Exponat: Integrierte Sprachtechnologielösungen <strong>und</strong> webbasierte Sprachdienstleistungen.<br />

<strong>Dresden</strong>, Kongresszentrum, 11. Juli 2004.<br />

57


Promotionen <strong>und</strong> Habilitationen<br />

6 Promotionen <strong>und</strong> Habilitationen<br />

am Institut für Akustik <strong>und</strong> Sprachkommunikation<br />

[1] WOLFF, M.: Automatisches Lernen von Aussprachewörterbüchern. Dissertation, TU <strong>Dresden</strong>,<br />

Fakultät Elektrotechnik <strong>und</strong> Informationstechnik. Gutachter: R. HOFFMANN (TU <strong>Dresden</strong>), G.<br />

RUSKE (TU München), K. FELLBAUM (BTU Cottbus). Tag der Verteidigung: 09.07.2004.<br />

[2] LESCHKA, STEPHAN: Entwurfsmethoden <strong>und</strong> Leistungsgrenzen elektromechanischer<br />

Schallquellen für Ultraschallanwendungen in Gasen im Frequenzbereich um 100 kHz<br />

Verteidigung: 30.07.2004, Gutachter: PROF. PFEIFER, PROF. SESSLER, PROF.<br />

WERTHSCHÜTZKY<br />

[3] HAIN, H.-U.: Phonetische Transkription für ein multilinguales Sprachsynthesesystem. Dissertation,<br />

TU <strong>Dresden</strong>, Fakultät Elektrotechnik <strong>und</strong> Informationstechnik. Gutachter: R.<br />

HOFFMANN (TU <strong>Dresden</strong>), W. ZÜHLKE (TU Ilmenau), H. HÖGE (UniBW München/Siemens<br />

AG). Tag der Verteidigung: 23.09.2004.<br />

externe Gutachtertätigkeit<br />

[4] BERTON, A.: Konfidenzmaße <strong>und</strong> deren Anwendung in der automatischen Sprachverarbeitung.<br />

Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen.<br />

Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung:<br />

5. 5. 2004.<br />

[5] HAMPICKE, M.: Optimierung von Smart-Home-Umgebungen für den Wohnbereich unter besonderer<br />

Berücksichtigung der elektronischen Sprachverarbeitung. Dissertation, BTU Cottbus,<br />

Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen. Gutachter: K.<br />

FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung: 5. 5. 2004.<br />

[6] HILARIO, J. M.: Discriminative connectionist approaches for automatic speech recognition in<br />

cars. Dissertation, BTU Cottbus, Fakultät für Maschinenbau, Elektrotechnik <strong>und</strong> Wirtschaftsingenieurwesen.<br />

Gutachter: K. FELLBAUM, Cottbus, R. HOFFMANN, <strong>Dresden</strong>. Tag der Verteidigung:<br />

31. 8. 2004.<br />

58


<strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong><br />

7 <strong>Diplom</strong>- <strong>und</strong> <strong>Studienarbeiten</strong><br />

7.1 <strong>Diplom</strong>arbeiten<br />

[DA1] HIRSCH, STEFAN: Programm zum Praktikum „Digitale Filterung“ (Dipl.-Ing. S. Kürbis), verteidigt<br />

am 17.03.2004.<br />

[DA2] MEHNER, REINHARD: Körperschallübertragung von Sprache durch bau- <strong>und</strong> gebäudetechnische<br />

Strukturen in Wohn- <strong>und</strong> Industriebauten (Dr. Fuder/Dr. Joiko), verteidigt am<br />

07.04.2004.<br />

[DA3] KÜHNE, MARCO: Stimmaktivierung eines Spracherkenners (Dipl.-Ing. M. Wolff), verteidigt am<br />

28.04.2004.<br />

[DA4] SOBE, DANIEL: Sprachsteuerung eines Computerspiels – Untersuchungen zur Leistungsfähigkeit<br />

<strong>und</strong> Ergonomie (Dipl.-Ing. M. Eichner), verteidigt am 28.07.2004.<br />

[DA5] STARKE, ERIC: Vergleich von Tieffrequenz-Wiedergabesystemen nach dem Dipol- <strong>und</strong> Bassreflexprinzip<br />

(Prof. Pfeifer), verteidigt am 29.09.2004.<br />

[DA6] OTTO, BJÖRN MICHAEL: Inbetriebnahme eines Systems zur elektroakustischen Manipulation<br />

des Fahrzeuginnengeräuschs im Betrieb (Prof. Hoffmann, Dr. Hoffmann, DaimlerChrysler<br />

AG), verteidigt am 13.10.2004.<br />

[DA7] TRÖGE, JAN: Erarbeitung von Konzepten zur gezielten akustischen Abstimmung eines Motorlagers<br />

(Prof. Pfeifer,Dr. Hofmann;DaimlerCrysler AG), verteidigt am 13.10.2004.<br />

[DA8] SCHULZE, CHRISTIAN: Anwendung eines Mikrofonarrays zur Ortung von Schallquellen (DI<br />

Zeibig), verteidigt am 10.11.2004.<br />

[DA9] ACHILLES, STEFAN: Aeroakustische Untersuchungen an umströmten Fahrzeugmodellen (DI<br />

Zeibig), verteidigt am 15.12.2004.<br />

[DA10] GARCIA VINAGRE, VICTOR: Generation of a Spanish Speech Database für a Text-to-<br />

Speech Synthesis System (Dipl.-Ing. Jokisch/<strong>Dresden</strong>), verteidigt im September 2004 Universidad<br />

de Valladolid (Spanien).<br />

[DA11] BERTOLA, VALERIO: Construction of an Italian and Spanish Diphone Data-Base for the<br />

DRESS Speech Synthesizer (Prof. Brofferio/Mailand; Dipl.-Ing. Jokisch/<strong>Dresden</strong>), verteidigt im<br />

Dezember 2004 Politecnico di Milano (Italien).<br />

7.2 <strong>Studienarbeiten</strong><br />

[SA1] SPARMANN, J.: Neubewertung von Umgebungsschall gemäß EU-Richtlinienentwurf KOM<br />

2000 (468) (Dr. Fuder), verteidigt am 30.06.2004.<br />

[SA2] KETTLITZ, M. W.: Messtechnische Untersuchung der Schallabstrahlung von Multipolen an<br />

einem Tragflügelmodell (DI Witing), verteidigt am 16.07.2004.<br />

[SA3] HOFMANN, M.: Optimierung einer trainingsbasierten Prosodiegenerierung (Dipl.-Ing.<br />

Jokisch), verteidigt am 08.09.2004.<br />

[SA4] GEYER, T.: Softwarekomponenten zur digitalen Signalverarbeitung mit DSP zur<br />

Vergrößerung des Dynamikumfanges herkömmlicher ADC/DAC (Dipl.-Ing. S. Kürbis, Dipl.-Ing.<br />

D. Richter), verteidigt am 08.09.2004.<br />

[SA5] DIENEROWITZ, S.: Fehleranalyse von Phonemhypothesengraphen (Dipl.-Ing. M. Cuevas),<br />

verteidigt am 08.09.2004.<br />

[SA6] GUST, N.: Zerstörungsfreie Verbindungsprüfung bei Schichtdicken im µm-Bereich mit Hilfe<br />

von Ultraschall (DI Richter), verteidigt am 03.11.2004.<br />

[SA7] PETER, A.: Subjektive <strong>und</strong> objektive Kriterien für die akustische Qualität eines Raumes (Dr.<br />

Bormann), verteidigt am 10.11.2004.<br />

[SA8] GIESLER, J.: Modellbildung <strong>und</strong> Sensitivitätsanalyse des Schwingungsverhaltens einer Kastenstruktur<br />

bei hohen Frequenzen (DI Knöfel), verteidigt am 01.12.2004.<br />

[SA9] LÖSCHKE, H.: Minimierung der Lärmstörungen in einem Großraumbüro (Dr. Fuder), verteidigt<br />

am 01.12.2004.<br />

[SA10] LIPPMANN, M.: Untersuchungen von Hohlspiegeln mit Mehrmikrofonanlagen (DI Zeibig),<br />

verteidigt am 15.12.2004.<br />

59


Wissenschaftliche Veranstaltungen<br />

8 Wissenschaftliche Veranstaltungen<br />

8.1 Auszeichnung von Herrn Dr.-Ing. Ennes S a r r a d j mit dem<br />

Lothar-Cremer-Preis der Deutschen Gesellschaft für Akustik<br />

im Jahre 2004<br />

Herr Dr. Ennes Sarradj, Jahrgang 1969, gehört zu den kompetentesten Nachwuchswissenschaftlern<br />

auf dem Gebiet der <strong>Technische</strong>n Akustik in Deutschland. Mit dem frühzeitigen Start seiner wissenschaftlichen<br />

Laufbahn (Promotion mit 29 Jahren) hat Herr Sarradj gegenwärtig bereits beeindruckende<br />

Forschungsergebnisse in der Akustik <strong>und</strong> überzeugende Aktivitäten in der Wissenschaftsorganisation<br />

vorzuweisen, insbesondere auf den Fachgebieten:<br />

• Statistische Energieanalyse <strong>und</strong> Körperschall<br />

• numerische Akustik (insbesondere BEM)<br />

• Schallabsorber, Messtechnik<br />

• Gehschall.<br />

Sein Hauptarbeitsgebiet ist das Verfahren der Statistischen Energieanalyse (SEA). Dieses Verfahren<br />

dient zur Untersuchung <strong>und</strong> Vorhersage des vibroakustischen Verhaltens komplexer, zusammengesetzter<br />

Strukturen (z. B. Maschinen, Bauwerke) bei hohen Frequenzen. Herr Dr. Sarradj hat dieses<br />

Verfahren um wertvolle wissenschaftliche <strong>und</strong> anwendungsorientierte Aspekte bereichert. Zur breiten<br />

Anwendung des Verfahrens <strong>und</strong> für einen einfachen Einstieg in die SEA hat Herr Sarradj im Internet<br />

eine kostenlose Software „FreeSEA“ zur Verfügung gestellt. Dabei soll durch einfache Beispiele, wie<br />

zur Schalltransmission zwischen benachbarten Räumen oder zur Körperschallanregung einer Karosserie,<br />

der „Einstieg in die Welt der SEA“ erleichtert werden. Dieses Programm wurde in den letzten<br />

drei Jahren weltweit von 2500 Interessenten heruntergeladen.<br />

Dr. Sarradj war Mitglied im – mittlerweile ausgelaufenen – thematischen EU-Netzwerk SEANET, an<br />

dem die TU <strong>Dresden</strong> als einzige deutsche <strong>Universität</strong> beteiligt war. Das Projekt vereinte 28 Partner<br />

aus 11 Ländern der EU, <strong>und</strong> zwar aus 7 Industrieunternehmen, 12 <strong>Universität</strong>en <strong>und</strong> 9 Forschungseinrichtungen.<br />

Ziele des Netzwerkes waren die Bündelung der Forschung zum Thema SEA, die Anwendung<br />

dieses Verfahrens <strong>und</strong> die Schaffung einer allgemeinen Methodenlehre. Dr. Sarradj hat sich<br />

außerordentlich aktiv an den Aufgaben dieses EU-Netzwerkes beteiligt.<br />

Ein zweites wichtiges Arbeitsgebiet von Dr. Sarradj ist das Gebiet des Gehschalls. Im Unterschied zu<br />

dem bekannten <strong>und</strong> genormten Begriff Trittschall wird mit der Bezeichnung Gehschall der Lärm charakterisiert,<br />

der durch das Begehen eines Fußbodens im begangenen Raum entsteht. Diese Problematik<br />

hat durch den verstärkten Einsatz von harten <strong>und</strong> damit lauten Bodenbelägen, wie z. B. den<br />

Laminat-Fußböden, an Bedeutung gewonnen.<br />

Als Beitrag von Dr. Sarradj kann die erstmalige Behandlung dieses Phänomens gelten, für das dieser<br />

neue Begriff „Gehschall“ mit einem DAGA-Vortrag 2000 eingeführt wurde. Er hat die physikalischen<br />

Entstehungsmechanismen des Gehschalls untersucht, er hat ein Prüfverfahren entwickelt, das die<br />

Einschätzung der akustischen Qualität von Fußböden hinsichtlich des Gehschalls ermöglicht, er hat<br />

sich insbesondere auch um die messtechnische Charakterisierung von Gehschall sehr verdient gemacht.<br />

Ein weiteres, langjähriges Arbeitsgebiet von Herrn E. Sarradj ist das Gebiet der Schallabsorber verschiedenartigster<br />

Ausführungen: Faserabsorber, Schaumstoffe, offenporige Asphalte <strong>und</strong> Betone,<br />

Granulate <strong>und</strong> Metallfasern. Dabei besteht sein wissenschaftlicher Beitrag (insbesondere im Zusammenhang<br />

mit porösen Fahrbahnoberflächen)<br />

- im Einsatz phänomenologischer, empirischer <strong>und</strong> mikrostruktureller Theorien zur Gewinnung von<br />

Absorberkennwerten aus den Parametern Strömungswiderstand, Tortuosität <strong>und</strong> Porosität,<br />

- in der Entwicklung <strong>und</strong> Validierung von Theorien zur Vorhersage der akustisch relevanten Parameter<br />

aus den technologischen Parametern des zur Fahrbahnherstellung eingesetzten Mischgutes<br />

(Korngrößenverteilung, Bindemittelanteil, Kornform),<br />

- in der Entwicklung eines Mehrbereich-Randelementeverfahrens zur Berechnung des Schallfeldes<br />

in der Umgebung von Absorbern.<br />

Dr. Sarradj gehört zum kleinen Kreis technischer Akustiker, die über das Know-how der Messverfahren<br />

zur Tortuosität <strong>und</strong> zu den Absorberkennwerten (Wellenwiderstand <strong>und</strong> Ausbreitungskonstante)<br />

auf der Gr<strong>und</strong>lage eigener wissenschaftlicher Arbeiten verfügen.<br />

60


Wissenschaftliche Veranstaltungen<br />

Im Zusammenhang mit den Schallabsorbern hat Herr Dr. Sarradj große Anteile an dem Forschungsprojekt<br />

„Einfluss der Fahrbahneigenschaften auf das Rollgeräusch von Kraftfahrzeugen“, das von der<br />

Deutschen Forschungsgemeinschaft finanziert worden ist. Dieses Projekt wurde gemeinsam vom<br />

Fachgebiet "<strong>Technische</strong> Akustik" <strong>und</strong> dem Fachgebiet "Straßenbau" der Fakultät Bauingenieurwesen<br />

bearbeitet. Die Ergebnisse liefern die Gr<strong>und</strong>lage für eine systematische <strong>und</strong> gezielte akustische Optimierung<br />

von ein- oder mehrschichtigen Fahrbahnaufbauten.<br />

Herr Dr. Sarradj hat sich in hohem Maße in der Lehre der <strong>Technische</strong>n Akustik betätigt. Er hat eine<br />

eigene Vorlesung mit dem Titel „Numerische Akustik“ aufgebaut, in der die in der Akustik verwendeten<br />

numerischen Verfahren behandelt <strong>und</strong> an Beispielen, in einer Projektarbeit <strong>und</strong> mit Verwendung handelsüblicher<br />

Softwarepakete, erprobt wurden. Dr. Sarradj war im Rahmen einer Vorlesungsreihe mit<br />

Vorlesungen zur Bauakustik, zur Lärmabwehr <strong>und</strong> zur Immissionsprognose beteiligt.<br />

Herr Sarradj hat hervorragende Organisationsfähigkeiten nachgewiesen. Bei der Einwerbung von<br />

Drittmitteln nahm er hinsichtlich selbständiger Kontaktanbahnung, Verhandlungsführung <strong>und</strong> Vertragsabschluss<br />

eine Spitzenstellung an der Fakultät ein. Dabei zeigte er ein übergewöhnliches Maß<br />

der Praxis des Managements <strong>und</strong> der Übernahme von Verantwortung, des Weiteren den Blick für den<br />

notwendigen Aufwand <strong>und</strong>, nicht unwesentlich, die erforderliche Korrektheit in den formalen Details. In<br />

der Logik dieser Fähigkeiten liegt seine gegenwärtige Tätigkeit: Dr. Sarradj ist seit Oktober 2002 ist<br />

Geschäftsführer der Gesellschaft für Akustikforschung <strong>Dresden</strong> mbH, einer stark wissenschaftlich<br />

orientierten Ausgründung aus dem akustischen Institut der TU <strong>Dresden</strong>.<br />

Durch seine hohe Fachkompetenz, seine fre<strong>und</strong>liche <strong>und</strong> hilfsbereite Art sowie durch sein „Stehvermögen“<br />

im wissenschaftlichen Streitgespräch werden die Zusammenarbeit mit ihm <strong>und</strong> die Mitarbeit<br />

unter seiner Leitung von Kollegen <strong>und</strong> Mitarbeitern als großer Gewinn empf<strong>und</strong>en.<br />

In der Referenz eines Fachkollegen heißt es:<br />

„Dr. Sarradj gehört für mich zu dem immer seltener werdenden Nachwuchs, der für theoretische Arbeiten<br />

in seinem Fach großes Interesse hat, gleichzeitig aber auch die ausgezeichnete Fähigkeit besitzt,<br />

sein theoretisches Wissen in praktischen Anwendungen umzusetzen.“<br />

Und ein anderer Gutachter schreibt:<br />

„Von Herrn Sarradj habe ich Vorträge gehört (ICSV Stockholm, ICA Rom), die mich durch ihre didaktische<br />

<strong>und</strong> wissenschaftliche Qualität sehr beeindruckt haben...“<br />

(P. Költzsch)<br />

8.2 Konferenz „Elektronische Sprachsignalverarbeitung“,<br />

Cottbus, 20. bis 22. September 2004<br />

Mit Herrn Professor Klaus Fellbaum von der Brandenburgischen TU Cottbus hatte wieder einmal einer<br />

der Mitbegründer unserer gemeinsamen Veranstaltungsreihe die Verantwortung für die Durchführung.<br />

Die Konferenz fand schon zum dritten Mal (nach 1997 <strong>und</strong> 2000) in dem sehr zweckmäßigen Hörsaalgebäude<br />

der BTU Cottbus statt. Insgesamt wurden 37 Vorträge <strong>und</strong> Poster in den Vortragsgruppen<br />

• Spracherkennung,<br />

• Sprachsynthese,<br />

• Akustik <strong>und</strong> Signalverarbeitung,<br />

• Technologie <strong>und</strong> Anwendung der Aprachsignalverarbeitung<br />

präsentiert. Als Besonderheit (gewissermaßen als Blick in die nahe Zukunft) wurde der Themenkomplex<br />

Mobile Computing, Ubiquitous Computing and Ambient Intelligence aufgenommen <strong>und</strong> durch die<br />

folgenden Hauptvorträge zur Diskussion gestellt:<br />

• P. Noll, TU Berlin: Sensing People – Localization with Microphone Arrays<br />

• C. Hentschel, BTU Cottbus: Ambient Intelligence – Vision <strong>und</strong> technische Lösungsansätze<br />

• A. Ullsperger, BTU Cottbus: Schlüsselinnovationen, Pilotprodukte <strong>und</strong> Thesen für Sprachverarbeitung<br />

bei Wearable Computing<br />

Der Tagungsband ist als Band 30 der „Studientexte zur Sprachkommunikation“ in der gewohnten<br />

Weise erschienen.<br />

61


Wissenschaftliche Veranstaltungen<br />

8.3 Elektrotechnisches Kolloquium „Kommunikationsakustik“ am<br />

8. Dezember 2004<br />

Die Elektrotechnischen Kolloquien werden vom VDE-Bezirksverein <strong>Dresden</strong> veranstaltet. Wir nehmen<br />

das 469. Kolloquium in diesen Jahresbericht auf, weil es im Zusammenhang mit der Wiederbesetzung<br />

unserer Akustikprofessur unter der modifizierten Widmung „Kommunikationsakustik“ dazu beitrug, das<br />

Verständnis für das wissenschaftliche Anliegen dieses Fachgebietes zu vertiefen. Der Referent, Herr<br />

Prof. Dr.-Ing. Dr. techn. h. c. Jens Blauert (Ruhr-<strong>Universität</strong> Bochum), kann als Pionier der Kommunikationsakustik<br />

auf einen überreichen F<strong>und</strong>us an Arbeiten zurückgreifen, die von ihm <strong>und</strong> seinen Mitarbeitern<br />

auf diesem Gebiet durchgeführt wurden. Er stellte daraus einen sehr informativen <strong>und</strong> anregenden<br />

Übersichtsvortrag zusammen.<br />

Um einen Eindruck vom Inhalt zu geben, drucken wir nachstehend die Abbildung <strong>und</strong> den Text ab, die<br />

der Autor für die Einladung zum Kolloquium zur Verfügung gestellt hatte:<br />

62<br />

Those aspects of acoustics which concern<br />

the relations of acoustics to the information<br />

and communication technologies are now<br />

frequently called “communication<br />

acoustics”. After a short review of the<br />

history of this field, relevant results from<br />

recent research at the Institute of<br />

Communication Acoustics at the Ruhr-<br />

University of Bochum, Germany, will be<br />

reported. This work can be seen in the light<br />

of the research areas of Computational<br />

Auditory Scene Analysis (CASA) and<br />

Auditory Virtual Environments (AVE) - both<br />

dealing with the parametric representation<br />

of auditory scenes. Recent application<br />

opportunities and future trends will be<br />

discussed. It will be argued that modern<br />

communication-acoustical systems – which<br />

are often only embedded components in<br />

more complex communication systems -<br />

require more and more built-in explicit<br />

knowledge. Among other things, the<br />

development of such components and<br />

systems calls for data and knowledge from<br />

the cognitive sciences.


Wissenschaftliche Veranstaltungen<br />

8.4 Statusseminar zum DFG-Projekt „Datenanalyseverfahren“<br />

Seit Dezember 2003 wird das DFG-Projekt „Entwicklung von Datenanalyseverfahren für die Qualitätsbewertung<br />

technischer Prozesse“ gemeinsam mit der FhG EADQ <strong>Dresden</strong> bearbeitet. Am 8. Dezember<br />

2004 fand dazu am Institut für Akustik <strong>und</strong> Sprachkommunikation der TU <strong>Dresden</strong> das 1. Statusseminar<br />

statt.<br />

Im Rahmen des Seminars wurden folgende Vorträge gehalten:<br />

1. Prof. R. Hoffmann: Einführung<br />

2. Dr. Hentschel (FhG EADQ): Ausgewählte Aspekte des akustischen Monitoring<br />

3. Dr. M. Wolff: Training <strong>und</strong> Erkennung<br />

4. C. Tschöpe (FhG EADQ): Experimente <strong>und</strong> bisherige Ergebnisse<br />

5. S. Werner: Aktueller Stand des DFG-Projekts<br />

Das Seminar zeigtenach nunmehr einem Jahr Projektlaufzeit, dass sich die Idee der Übertragung von<br />

Algorithmen, die sich in der Spracherkennung bewährt haben, auf allgemeinere Probleme der Prozessanalyse<br />

als tragfähig erwiesen hat. Insbesondere sind dabei die Algorithmen des Strukturlernens<br />

zu nennen, die zuletzt in der Dissertation von M. Wolff zusammengefasst wurden. Auf dieser Basis<br />

wurden die folgenden Aufgaben im Rahmen des DFG-Projektes präzisiert.<br />

9 Institutskolloquien<br />

14.01.2004<br />

11.02.2004<br />

25.02.2004<br />

10.03.2004<br />

07.04.2004<br />

12.05.2004<br />

16.06.2004<br />

30.06.2004<br />

14.07.2004<br />

Fuder, G./Bormann, V.:<br />

Gesichtspunkte der Grenzwertfestlegung zur Vermeidung von Gehörschäden<br />

Ding, H.:<br />

Graphem-Phonem-Umsetzung im Chinesischen<br />

Hübelt, J.:<br />

Schallabsorber (poröse Hohlkugeln) FhG-Projekt<br />

Bauer, M./Zeibig, A., Költzsch, P.:<br />

Abschluss SWING/SWING + DFG-Verb<strong>und</strong>projekt Aeroakustik<br />

Leschka, St.:<br />

Verfahren <strong>und</strong> Grenzen bei der Erzeugung von Ultraschall in Luft<br />

Knöfel, B.:<br />

Akustische Simulationsverfahren (Körperschall)<br />

Kühnicke, E.:<br />

Aktuelle Entwicklungen aus dem Bereich des Ultraschalls<br />

Folprecht, St..<br />

Messfehleranalyseverfahren im Vergleich<br />

Brick, H., Piscoya, R., Ochmann, M., Költzsch, P.:<br />

Verbrennungslärm (DFG-Forschergruppe)<br />

63


10 Reisen<br />

Prof. Hoffmann<br />

Dipl.-Ing. Jokisch<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Reisen<br />

Beratung zum Projekt lexDRESS<br />

Martin-Luther-<strong>Universität</strong> Halle<br />

Ehrenkolloquium Prof. Lacroix<br />

Goethe-<strong>Universität</strong> Frankfurt/Main<br />

12.01.2004<br />

16.01.2004<br />

Dipl.-Ing. Zeibig DGLR-FA-Sitzung „Fluglärm“ 30.01.2004<br />

Prof. Pfeifer Statuskolloquium Mikrosystemtechnik<br />

Karlsruhe<br />

Prof. Hoffmann BMBF-Gutachter-Informationsveranstaltung zum<br />

Programm FH³, Fachhochschule Düsseldorf<br />

Dipl.-Ing.Eichner <strong>IAS</strong>TED International Conference on Web-Based<br />

Education, Innsbruck<br />

Prof. Hoffmann Erweiterte Vorstandssitzung der ITG<br />

München<br />

Dr.-Ing. Fuder Sitzung NALS/NATG A1<br />

Berlin<br />

Prof. Hoffmann<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Lachmann<br />

Dipl.-Ing. Strecha<br />

Arbeitstreffen VRDG SIEMENS<br />

Preparatory Meeting ECESS<br />

München<br />

Prof. Költzsch Sitzung Klasse Technikwissenschaften, Rat der Akademie<br />

(BBAW)<br />

Berlin<br />

Prof. Költzsch<br />

Dipl.-Ing. Bauer<br />

Dipl.-Ing. Zeibig<br />

SWING-Workshop<br />

Aachen<br />

Dr.-Ing. Piscoya Projekttreffen Forschergruppe „Verbrennungslärm“<br />

Karlsruhe<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Prof. Költzsch<br />

Dr.-Ing. Bormann<br />

Dr.-Ing. Fuder 24. Sitzung des NVT 5<br />

Bremen<br />

Dipl.-Ing. Jokisch<br />

MSc. Oba<br />

D. Sobe<br />

64<br />

International Workshop in Phonetics Dedicated to the<br />

Memory of Farkas Kempelen<br />

Hungarian Academy of Sciences, Budapest<br />

09.02. - 11.02.2004<br />

11.02.2004<br />

15.02. - 19.02.2004<br />

17.02.2004<br />

19.02.2004<br />

19.02. - 20.02.2004<br />

19.02. -20.02.2004<br />

25.02. - 29.02.2004<br />

04.03. - 05.03.2004<br />

11.03. - 13.03.2004<br />

3. Workshop „Strukturbildung <strong>und</strong> Innovation“ 11.03. - 13.03.2004<br />

CeBIT<br />

Hannover<br />

11.03. - 14.03.2004<br />

18.03. - 21.03.2004<br />

18.03. - 23.03.2004<br />

20.03. - 24.03.2004


Prof. Hoffmann<br />

Prof. Költzsch<br />

Prof. Mehnert<br />

Dipl.-Ing. Bauer<br />

Dr.-Ing. Bormann<br />

Dr. Ding<br />

Dipl.-Ing. Knöfel<br />

Ch. Schulze<br />

Dipl.-Ing. Zeibig<br />

Reisen<br />

Gemeinschaftstagung<br />

7ème Congrès Français d’Acoustique (CFA) /<br />

30. Deutsche Jahrestagung für Akustik (DAGA)<br />

Strassburg (Frankreich)<br />

Dipl.-Ing. Jokisch International Conference Speech Prosody 2004<br />

Nara (Japan)<br />

Dipl.-Ing. Jokisch International Symposium on Tonal Aspects of<br />

Languages (TAL 2004)<br />

Beijing (China)<br />

Dipl.-Ing. Werner International Conference on Information Technology<br />

(ITCC)<br />

Las Vegas (USA)<br />

Prof. Költzsch 44. Sitzung AK (Umweltb<strong>und</strong>esamt)<br />

Berlin<br />

Prof. Pfeifer Vortragsreihe Audiobeam<br />

Villingen-Schwenningen<br />

Dipl.-Ing. Hübelt Vortrag ICA Kyoto<br />

Kyoto (Japan)<br />

Dr.-Ing. Feldmann COST 277 (Nonlinear Speech Processing)<br />

Management Committee Meeting & Seminar<br />

Limerick (Irland)<br />

Prof. Költzsch<br />

S. Achilles<br />

Dipl.-Ing. Zeibig<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Strecha<br />

Projektberatung<br />

Braunschweig<br />

Themenverteidigung VRDG SIEMENS<br />

München<br />

Prof. Hoffmann Kolloquium Kommunikationsakustik<br />

Ruhr-<strong>Universität</strong> Bochum<br />

Prof. Költzsch Projektberatung Verbrennungslärm<br />

TFH Berlin<br />

Prof. Hoffmann Zukunft durch Informationstechnik<br />

Jubiläumsfachtagung 50 Jahre ITG<br />

Frankfurt/Main<br />

22.03. - 25.03.2004<br />

23.03. - 26.03.2004<br />

28.03. - 30.03.2004<br />

05.04. - 07.04.2004<br />

31.03.2004<br />

01.04. - 03.04.2004<br />

03.04. - 12.04.2004<br />

15.04. - 16.04.2004<br />

15.04.2004<br />

19.04.2004<br />

23.04.2004<br />

22.04. - 23.04.2004<br />

26.04. - 27.04.2004<br />

Dipl.-Ing. Hübelt Vortrag MEATV München 28.04.2004<br />

Prof. Hoffmann Festkolloquium zum 60. Geburtstag<br />

Prof. Fastl <strong>und</strong> Prof. Ruske<br />

TU München<br />

Prof. Hoffmann Verteidigung der Dissertationen Berton <strong>und</strong> Hampicke<br />

Brandenburgische TU Cottbus<br />

Doz. Dr. Kühnicke Vortrag zerstörungsfreie Prüfung<br />

Salzburg<br />

30.04.2004<br />

05.05.2004<br />

15.05. - 20.05.2004<br />

65


Prof. Hoffmann<br />

Dipl.-Ing. Eichner<br />

Dipl.-Inf. Tschöpe<br />

Dipl.-Ing. Werner<br />

Dipl.-Ing. Wolff<br />

Reisen<br />

IEEE International Conference on Acoustics, Speech,<br />

and Signal Processing (ICASSP)<br />

Montreal (Kanada)<br />

Dr.-Ing. Kordon Projektbesprechung mit Institut für Musik-<br />

instrumentenbau Zwota <strong>und</strong> Projektträger BMBF<br />

Markneukirchen<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Arbeitsbesuche T-Systems /Prof. Endres /Prof. Wolf<br />

TU Darmstadt / <strong>Universität</strong> Frankfurt<br />

Phonetik-Workshop (Prof. Köster)<br />

<strong>Universität</strong> Trier<br />

Prof. Hoffmann Verteidigung Habilitationsschrift Dr. Hollmach /<br />

Dissertation Ulbrich<br />

Martin-Luther-<strong>Universität</strong> Halle (Saale)<br />

Dipl.-Ing. Jokisch Kooperationsworkshop T-Systems / TU <strong>Dresden</strong><br />

<strong>Dresden</strong><br />

Dr.- Ing. Kordon Projektvorbereitung Musicon Valley<br />

Markneukirchen<br />

Dr.-Ing. Fuder 25. Sitzung NVT 5<br />

Halle/Saale<br />

Prof. Hoffmann Conference and Workshop on Assistive Technologies<br />

for Vision and Hearing Impairment (CVHI 2004)<br />

Granada (Spanien)<br />

Dipl.-Ing. Jokisch Netzwerkseminar der Stiftung Industrieforschung<br />

Hamburg<br />

Dipl.-Ing. Knöfel<br />

Dipl.-Ing. Zeibig<br />

Prof. Hoffmann<br />

Dr. Ding<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Strecha<br />

Dr.-Ing. Piscoya<br />

Dipl.-Ing. Richter<br />

Tagung IC SV 11<br />

St. Petersburg<br />

11th International Workshop Advances in Speech<br />

Technology (AST ‘04)<br />

ECESS Meeting (European Center of Excellence in<br />

Speech Synthesis)<br />

University of Maribor (Slowenien)<br />

Messungen<br />

TU Darmstadt<br />

17.05. - 21.05.2004<br />

25.05.2004<br />

03.06.2004<br />

04.06.2004<br />

17.06.2004<br />

22.06.2004<br />

22.06.2004<br />

23.06. - 24.06.2004<br />

29.06. - 02.07.2004<br />

01.07. - 03.07.2004<br />

05.07. - 09.07.2004<br />

06. 07.- 08.07.2004<br />

14.07. - 16.07.2004<br />

Prof. Pfeifer Wedemark 28.07. - 29.07.2004<br />

Dr.-Ing. Piscoya Mitarbeitertreffen<br />

Aachen<br />

Prof. Hoffmann<br />

Dr.-Ing. Kordon<br />

Dipl.-Ing. Knöfel<br />

Ch.Schulze<br />

Dipl.-Ing. Zeibig<br />

66<br />

Projektbesprechung mit Institut für Musik-<br />

instrumentenbau Zwota <strong>und</strong> Projektträger BMBF<br />

Markneukirchen<br />

Konferenz Internoise 2004<br />

Prag (Tschechien)<br />

29.07. - 30.07.2004<br />

04.08.04<br />

22.08. - 25.08.2004


Reisen<br />

Prof. Hoffmann Verteidigung Dissertation Hilario<br />

Brandenburgische TU Cottbus<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Strecha<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Arbeitstreffen VRDG SIEMENS<br />

München<br />

Historisch-Phonetische Sammlung<br />

<strong>Universität</strong> Hamburg<br />

Dr.-Ing. Feldmann COST 277-Meeting / International Summer Scholl<br />

„Nonlinear Speech Processing“<br />

Vietri sul Mare (Italien)<br />

Prof. Hoffmann<br />

Dipl.-Ing. Eichner<br />

Dr.-Ing. Kordon<br />

Dipl.-Ing. Kortke<br />

MSc. Oba<br />

Dipl.-Ing. Sobe<br />

Dr.-Ing. Wolff<br />

14th Czech-German Workshop “Speech Processing”<br />

Prag (Tschechien)<br />

Prof. Hoffmann Konferenz „Verarbeitung natürlicher Sprache“<br />

(KONVENS), Wien<br />

Prof. Költzsch Projekttreffen Verbrennungslärm/Workshop<br />

Bad Honeff<br />

Dipl.-Ing. Brick 11. Workshop „Physikalische Akustik“<br />

Bad Honeff<br />

Prof. Költzsch DLR-Kongress<br />

<strong>Dresden</strong><br />

Prof. Hoffmann<br />

Dr.-Ing. Kordon<br />

Prof. Hoffmann<br />

Prof. Mehnert<br />

Dipl.-Ing. Eichner<br />

M. Hofmann<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Sobe<br />

Dipl.-Ing. Strecha<br />

Dr.-Ing. Wolff<br />

Dipl.-Ing. Zeibig<br />

M. Lippmann<br />

Sitzung der ITG-Fachgruppen 4.3 <strong>und</strong> 4.4<br />

Brandenburgische TU Cottbus<br />

Konferenz „Elektronische Sprachsignalverarbeitung“<br />

Brandenburgische TU Cottbus<br />

Abholung akustischer Hohlspiegel<br />

Lampertswalde<br />

Prof. Költzsch Ehrenkolloquium Prof. Obermeier<br />

Freiberg<br />

Dipl.-Ing. Bauer Teilnahme an Überflugmessungen<br />

Flughafen Coschstedt<br />

Prof. Hoffmann<br />

Dipl.-Ing. Eichner<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Kühne<br />

International Conference on Spoken Language<br />

Processing (ICSLP – INTERSPEECH)<br />

Jeju (Korea)<br />

25.08.2004<br />

26.08.2004<br />

06.09. - 07.09.2004<br />

13.09. - 18.09.2004<br />

13.09. - 15.09.2004<br />

14.09. - 17.09.2004<br />

15.09. - 18.09.2004<br />

16.09. - 18.09.2004<br />

20.09. - 21.09.2004<br />

20.09.2004<br />

20.09. - 22.09.2004<br />

24.09.2004<br />

24.09.2004<br />

30.09./02.10./03.10.<br />

04.10. - 08.10.2004<br />

67


Reisen<br />

Prof. Pfeifer XVIII. Messtechnisches Symposium<br />

Freiburg<br />

Prof. Hoffmann Vortrag für T-Systems,<br />

Customer Care Center Circle für Versicherungen<br />

Leipzig<br />

Prof. Költzsch Lehrgang „Stömungsindizierter Lärm“<br />

Erlangen<br />

Dipl.-Ing. Zeibig Vortrag Konferenz „Saterra“<br />

Mittweida<br />

Dipl.-Ing. Bauer Disk. akt. Forschungsaufgaben (R. Bosch GmbH)<br />

Stuttgart<br />

Dipl.-Ing. Bauer STAB-Tagung<br />

Bremen<br />

Prof. Hoffmann VDE-Kongress“Innovationen für Menschen“<br />

mit ITG-Fachtagung „Ambient Intelligence“<br />

Berlin<br />

Dipl.-Ing. Zeibig Vortrag Fo.-Kolloquium <strong>Universität</strong> Erlangen<br />

Erlangen<br />

Dipl.-Ing. Eichner<br />

Dipl.-Ing. Jokisch<br />

Dipl.-Ing. Lachmann<br />

Prof. Hoffmann<br />

Dipl.-Ing. Eichner<br />

Dipl.-Ing. Werner<br />

Dr.-Ing. Wolff<br />

Arbeitstreffen VRDG SIEMENS<br />

München<br />

Gemeinsame Präsentation mit VIC <strong>Dresden</strong><br />

München<br />

Dipl.-Ing. Jokisch ECESS Meeting (European Center of Excellence in<br />

Speech Synthesis)<br />

Universitat Politècnica de Catalunya, Barcelona<br />

Prof. Hoffmann<br />

Dr. Ding<br />

Dipl.-Ing. Jokisch<br />

4th International Symposium on Chinese Spoken<br />

Language Processing<br />

Hongkong<br />

Prof. Hoffmann Ausstellung “Phonorama“<br />

(Eine Kulturgeschichte der Stimme als Medium)<br />

Zentrum für Kunst- <strong>und</strong> Medientechnologie<br />

Karlsruhe<br />

68<br />

03.10. - 06.10.2004<br />

11.10.2004<br />

11.10. - 14.10.2004<br />

12.11.2004<br />

14.10. - 15.10.2004<br />

16.11. - 17.11.2004<br />

18.10. - 19.10.2004<br />

23.10. - 25.10.2004<br />

09.11.2004<br />

24.11.2004<br />

09.12. - 10.12.2004<br />

15.12. - 18.12.2004<br />

30.12.2004


Aktivitäten in der wissenschaftlichen Gemeinschaft<br />

11 Aktivitäten in der wissenschaftlichen Gemeinschaft<br />

11.1 Akademische Selbstverwaltung<br />

Dr.-Ing. G. Fuder<br />

- Mitglied der Berufungskommission „Kommunikationsakustik“<br />

Prof. R. Hoffmann<br />

- Mitglied des Konzils der TU <strong>Dresden</strong><br />

- Mitglied des Rates der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />

- Mitglied der Strukturkommission der Fakultät Elektrotechnik <strong>und</strong> Informationstechnik<br />

- Leiter der Studienrichtung Informationstechnik im Studiengang Elektrotechnik<br />

- Vorsitzender der Berufungskommission „Regelungs- <strong>und</strong> Steuerungstheorie“<br />

- Mitglied der Berufungskommission „Kommunikationsakustik“<br />

Prof. P. Költzsch<br />

- Mitglied der Fakultät Maschinenwesen<br />

Dr.-Ing. U. Kordon<br />

- Mitglied der Berufungskommission „Kommunikationsakustik“<br />

Dr. E. Kühnicke<br />

- Mitglied im Promotionsausschuss der <strong>Technische</strong>n <strong>Universität</strong> <strong>Dresden</strong><br />

11.2 Mitarbeit in Gremien<br />

Dr. V. Bormann<br />

- Mitglied der Deutschen Lichttechnischen Gesellschaft (LiTG), Bezirksgruppe <strong>Dresden</strong>;<br />

Vorstandsmitglied (Schriftführer <strong>und</strong> Schatzmeister)<br />

- Mitglied in REFA<br />

- Mitglied im Fachinstitut für Arbeitsaudit <strong>Dresden</strong> e.V. (FIAD); Geschäftsführung<br />

Dr. G. Fuder<br />

- Mitglied im DEGA-Fachausschuss „Hörakustik“<br />

- Mitglied im Normausschuss NALS/NATG A 1 „Terminologie <strong>und</strong> Einheiten der Akustik“<br />

- Mitglied im Normausschuss NVT 5 „Tontechnik in Theatern <strong>und</strong> Mehrzweckhallen“<br />

Prof. Dr. R. Hoffmann<br />

- Vorsitzender des ITG-Fachausschusses 7.4 "Sprachakustik“<br />

- Mitglied der ISCA Special Interest Group „Speech Synthesis“ (SynSIG)<br />

- Mitglied des Landesausschusses der U.R.S.I., Kommission C (Signals and Systems)<br />

- Gutachter im Programm des BMBF zur Förderung angewandter Forschung an Fachhochschulen<br />

im Verb<strong>und</strong> mit der Wirtschaft (FH³)<br />

- Reviewer für das Zentralblatt für Mathematik<br />

- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis)<br />

- Mitglied des Management Committee der Aktion COST 277<br />

Dipl.-Ing. O. Jokisch<br />

- Reviewer für JASA<br />

- Gründungsmitglied des ECESS (European Center of Excellence in Speech Synthesis)<br />

69


Aktivitäten in der wissenschaftlichen Gemeinschaft<br />

Prof. Dr. P. Költzsch<br />

- Mitglied des interdisziplinären Arbeitskreises Lärmminderungsforschung beim Umweltb<strong>und</strong>esamt<br />

- Mitglied der Deutschen Gesellschaft für Akustik (DEGA)<br />

- Mitglied des Vorstandsrates der DEGA<br />

- Mitglied der Jury zur Vergabe des Lothar-Cremer-Preises der DEGA bis August 2003<br />

- Mitglied der DEGA-Fachausschüsse „ Lehre in der Akustik“ <strong>und</strong> „Physikalische Akustik“<br />

- Mitglied des Deutschen Hochschulverbandes (DHV)<br />

- Obmann des Normausschusses NALS/NATG A1 „Terminologie <strong>und</strong> Einheiten der Akustik“ (bis<br />

Februar 2003)<br />

- Mitglied des Facharbeitskreises „Wohnges<strong>und</strong>heit <strong>und</strong> Innenausbau“ des Arbeitsgemeinschaft<br />

für Bauforschung im B<strong>und</strong>esministerium für Raumordnung, Bauwesen <strong>und</strong> Städtebau<br />

- Stellvertretender Obmann des Fachausschusses T 2.4 „Strömungsakustik/Fluglärm“ der DGLR<br />

(Deutsche Gesellschaft für Luft- <strong>und</strong> Raumfahrt)<br />

- Ordentliches Mitglied der Berlin-Brandenburgischen Akademie der Wissenschaften (vormals<br />

Preußische Akademie der Wissenschaften), Klasse Technikwissenschaften<br />

- Mitglied des Rates der Berlin-Brandenburgischen Akademie der Wissenschaften<br />

- Mitglied von „acatech“, dem Konvent für Technikwissenschaften der Union Deutscher Akademien<br />

der Wissenschaften<br />

- Gründungsmitglied des Universitären Zentrums für Luft- <strong>und</strong> Raumfahrt der <strong>Technische</strong>n <strong>Universität</strong><br />

<strong>Dresden</strong><br />

Dr. U. Kordon<br />

- Mitglied des ITG-Fachausschusses 7.3 „Sprachverarbeitung“<br />

Doz. Dr. E. Kühnicke<br />

- Mitglied des Board of Reviewers für JASA <strong>und</strong> Wave Motion<br />

- Mitglied des Fachausschusses Ultraschallprüfung der DGZfP (Deutsche Gesellschaft für<br />

Zerstörungsfreie Prüfung)<br />

- Mitglied im Unterausschuss „Theoretische Modelle in der Ultraschallprüfung“ der DGZfP<br />

- Mitglied im DEGA-Fachausschuss Ultraschall<br />

- Mitglied im Ausschuss Hochschullehrer im Lehrgebiet der ZfP<br />

- Mitglied TIMUG (Technologien in Medizin <strong>und</strong> Ges<strong>und</strong>heitswesen)<br />

Prof. Dr. G. Pfeifer<br />

- Mitglied des Arbeitskreises „Hochschullehrer für Messtechnik“<br />

- Gutachtertätigkeit für die DFG<br />

- Mitglied des Deutschen Hochschulverbandes (DHV)<br />

Dipl.-Ing. A. Zeibig<br />

- Mitglied AIAA (American Institute of Aeronautics and Astronautics)<br />

11.3 Mitarbeit in Programmkomitees<br />

Prof. Dr.-Ing. habil. R. Hoffmann<br />

- Jubiläumsveranstaltung „Zukunft durch Informationstechnik“, 50 Jahre ITG, Frankfurt,<br />

26. - 27.4.2004<br />

- KONVENS 2004, Konferenz „Verarbeitung natürlicher Sprache“, Wien, 14. – 17.9.2004<br />

- ESSV 2004, 15. Konferenz Elektronische Sprachsignalverarbeitung, Cottbus, 20. -22- 9.2004<br />

- VDE-Kongress „Innovationen für Menschen“, Fachtagung „Ambient Intelligence“ der ITG, Berlin,<br />

18. – 20.10.2004<br />

- International Conference „Speech Prosody 2006“, <strong>Dresden</strong>, 2. – 5.5.2006 (General Chair)<br />

Dipl.-Ing. O. Jokisch<br />

� International Conference „Speech Prosody 2006“, <strong>Dresden</strong>, 2. – 5.5.2006 (Technical Chair)<br />

70


Schlussbemerkung aus:<br />

Ulrich Bräker: Etwas über William Shakespeares Schauspiele … (1780)<br />

Reproduktion nach dem Erstdruck im Jahrbuch der deutschen Shakespeare-Gesellschaft 12 (1877).<br />

71

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!