13.02.2013 Aufrufe

Kurzbericht 2007 Electronics und Medical Signal Processing

Kurzbericht 2007 Electronics und Medical Signal Processing

Kurzbericht 2007 Electronics und Medical Signal Processing

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Dieser Gesamtprozess, bestehend aus blinder Quellentrennung, Zeit-Frequenzmaskierung <strong>und</strong><br />

anschließender Missing-Feature-Erkennung ist im vergangenen Jahr für verschiedene ICA-<br />

Methoden untersucht <strong>und</strong> optimiert worden. Unter anderem wurde es eingesetzt mit JADE,<br />

mit von Dipl.-Ing. Eugen Hoffmann entwickelten, statistisch motivierten Maskierungsverfahren,<br />

<strong>und</strong> in gemeinsamer Arbeit mit den NTT Communication Science Laboratories in<br />

ausserdem Kyoto für basierend den Maximum auf SNR dem Beamformer. Forschungsaufenthalt Im letztgenannten im Projekt vergangenen wurde ausserdem Jahr der<br />

Large-Vocabulary-Erkenner basierend auf dem Forschungs-aufenthalt von NTT, im SOLON, vergangenen umJahr die der von Large-Vocabulary- Dipl.-Ing. Dorothea<br />

Erkenner von NTT, SOLON, um die von Dipl.-Ing. Dorothea Kolossa entwickelten Missing<br />

Kolossa Feature entwickelten Techniken erweitert. Missing Feature Techniken erweitert.<br />

100,0<br />

80,0<br />

60,0<br />

40,0<br />

20,0<br />

0,0<br />

Mischungen<br />

MaxSNR<br />

Beamformer<br />

Beamformer +<br />

Maske<br />

+ Missing<br />

Features<br />

Sub 20,9 5,2 8,0 6,9<br />

Del 2,3 0,8 2,2 3,0<br />

Ins 48,2 39,4 27,5 8,5<br />

PA 28,5 54,4 62,3 81,6<br />

Abb1: Beispiel für verbesserte Spracherkennung durch Maximum SNR Beamforming <strong>und</strong><br />

Abbildung 4: Beispiel für verbesserte Spracherkennung durch Maximum SNR<br />

Missing-Data-Techniken unter Verwendung des NTT-Erkenners SOLON. Angegeben sind<br />

Beamforming Fehler durch <strong>und</strong> Löschungen Missing-Data-Techniken (Del), Vertauschungen unter (Sub), Verwendung Einfügungen (Ins), des<strong>und</strong> NTT-Erkenners<br />

die<br />

SOLON. Erkennungsrate Angegeben (PA). sind Getestet Fehler wurde durch mit 1080 Löschungen Sätzen bestehend (Del), aus Vertauschungen 12146 Worten, nachdem (Sub),<br />

Einfügungen zwei Sprecher (Ins), mit gemessenen <strong>und</strong> die Impulsantworten Erkennungsrate aus einem (PA). Konferenzraum Getestet wurde künstlich mit 1080<br />

Sätzen<br />

gemischt<br />

bestehend<br />

wurden.<br />

aus 12146 Worten, nachdem zwei Sprecher mit gemessenen<br />

Impulsantworten aus einem Konferenzraum künstlich gemischt wurden.<br />

Mehrkanalige <strong>Signal</strong>verarbeitung<br />

Dorothea Kolossa & Eugen Hoffmann<br />

Um die Methoden der Blinden Quellenrennung (Blind Source Separation) <strong>und</strong><br />

ICA (Independent Component Analysis) für akustische <strong>Signal</strong>e zu entwickeln, zu<br />

verbessern <strong>und</strong> in realen Anwendungsfällen zu testen, befasst sich die Gruppe<br />

mit der Rekonstruktion gestörter Sprache <strong>und</strong> zielt dabei auf eine Verbesserung<br />

der Sprachqualität <strong>und</strong> Sprachverständlichkeit in gestörten Umgebungen <strong>und</strong> in<br />

Umgebungen, in denen mehrere Sprecher gleichzeitig aktiv sind. Die Gr<strong>und</strong>idee<br />

der ICA besteht darin, mehrkanalige <strong>Signal</strong>e in ihre statistisch unabhängigen<br />

Komponenten zu zerlegen. Da die Trennung blind, d.h. ohne Vorwissen über die<br />

Mischung oder die Quellen erfolgt, wird sie bei Mischungen von Luftschall als<br />

akustische blinde Quellentrennung bezeichnet.<br />

6

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!