PROGRAMM - DAGA 2012
PROGRAMM - DAGA 2012 PROGRAMM - DAGA 2012
124 DAGA 2012 ProgrammDi. 16:30 radon 3.05 SprachverarbeitungMethoden zur indirekten Bewertung der Qualitätswahrnehmungasynchroner audiovisueller SpracheS. WilsonDeutsche Telekom Laboratories, TU BerlinDie Qualitätswahrnehmung audiovisueller Sprache ist eine wichtigerEinflussgröße hinsichtlich der Akzeptanz sprachbasierter multimodalerSystemen. Einer der möglichen Faktoren ist dabei die Asynchronität zwischenTon und Bild, welche sowohl auf die Qualität als auch die Akzeptanzeines Systems einwirken kann. Dieser Beitrag stellt ein Frameworkvor, welches darauf abzielt, mittels indirekter Methoden eine automatischeBewertung der wahrgenommenen Qualität und der Akzeptanzasynchroner Sprache vorzunehmen. Ergebnisse von Experimentenbezüglich der direkten Bewertung von asynchroner Sprache werdenberichtet. Weiterhin wird ein statistisches Verfahren zur Detektionvon Asynchronität anhand automatisch erzeugter audiovisueller Merkmalebeschrieben. Abschließend wird ein statistisches Modell zur indirektenBewertung wahrgenommener Qualität vorgestellt, basierend aufden verallgemeinerten trainierten Verbindungen zwischen der automatischengemessenen Asynchronität und der direkt, experimentell gemessenenWahrnehmung davon.Di. 16:55 radon 3.05 SprachverarbeitungCodebook-based Bandwidth Extension with Side-InformationJ. Freudenberger und M. MüllerHTWG KonstanzArtificial bandwidth extension techniques can enhance the quality of narrowbandspeech transmission, but may cause artifacts with noisy speechsignals. This work presents a speech transmission technique usingbandwidth extension with side information for A-law encoded speech signals.A-law companding is standardized in the ITU-T G.711 standardand used in telecommunication systems like ISDN networks or the Bluetoothspeech link. The approach by Heping Ding requires 24 bits of sideinformation for each speech frame. The new codebook based approachrequires at most 12 bits of side information per 20 ms speech frame.Embedding a small number of bits as side information in the least significantbit position results in almost inaudible distortions. Hence, it ensuresbackwards compatibility for ordinary receivers without BWE decoder.The presented approach improves the speech quality for noise free andnoisy speech signals compared to a narrowband transmission and toartificial bandwidth extension. The speech quality has been evaluatedby means of instrumental quality measures as well as informal listeningtests with 20 persons.
Programm DAGA 2012 125Di. 17:20 radon 3.05 SprachverarbeitungInstrumental Musical Tones Measurement of Arbitrary Noise ReductionSystemsH. Yu und T. FingscheidtTU Braunschweig, Institut für NachrichtentechnikInstrumental measurement of noise reduction systems has to deal withseveral aspects such as the speech component quality, the level of noiseattenuation, and noise distortion in terms of musical tones. Severalmethods exist already for the first two aspects, while the instrumentalmeasurement of musical tones still remains a challenging task. Recently,the exploration of the log-kurtosis ratio for instrumentally measuringmusical tones has led to white box test methodologies requiring specificinformation of the particular noise reduction algorithm. In this paper, anew instrumental musical tones measurement is proposed, which enablesmusical tones measurement with unknown noise reduction systemsin a black box test. The proposed instrumental measure has been verifiedby a subjective listening test.Di. 17:45 radon 3.05 SprachverarbeitungÜber ein neues Verfahren zur RückkopplungsreduzierungH. Pastillé und R. SehlmeyerIAV GmbHInnenraumkommunikationssysteme in Kraftfahrzeugen stoßen an ihreGrenzen, wenn es darum geht, die Sprachübertragung mit dem nötigenPegel auszustatten, um die spektrale Ergänzung umzusetzen. Die Systemegeraten leicht in die Rückkopplung, als Vorstufe klingt die Stimmeoft schon ”blechern”. Das hier vorgestellte Verfahren erlaubt eine Erhöhungder Verstärkung um durchschnittlich 2 dB. Als Einschränkung mussangemerkt werden, dass dieses Verfahren nur für Sprache tauglich ist.Di. 18:10 radon 3.05 SprachverarbeitungReference-free SNR Measurement for Speech in Car NoiseB. Fodor und T. FingscheidtTU Braunschweig, Institut für NachrichtentechnikSignal-to-noise (SNR) measurement of noisy speech signals is an importanttopic in automotive environments, e.g., for investigating optimalmicrophone positions. This contribution presents an SNR measurementmethod for speech signals distorted by car noise within a typical rangeof SNR values. The proposed method offers low complexity and aims atproviding similar results as SNR measurements based on active speechand noise levels obtained from ITU-T Recommendation P.56, however,in a reference-free fashion. ”Reference-free” means that the SNR is estimatedby means of only the noisy speech signal, i.e., no clean speechor noise reference signals are used. Within the measuring process, thespeech and noise power are estimated separately. The SNR is then calculatedas the ratio between the estimated speech and noise powers.
- Seite 76 und 77: 74 DAGA 2012 ProgrammDi. 15:15 Spec
- Seite 78 und 79: 76 DAGA 2012 Programmdem komplexen
- Seite 80 und 81: 78 DAGA 2012 Programmmit Hilfe von
- Seite 82 und 83: 80 DAGA 2012 ProgrammDienstag (bis
- Seite 84 und 85: 82 DAGA 2012 ProgrammSchallfeldzerl
- Seite 86 und 87: 84 DAGA 2012 Programmund instantan
- Seite 88 und 89: 86 DAGA 2012 ProgrammSitzung „Num
- Seite 90 und 91: 88 DAGA 2012 Programmnumerischen Ak
- Seite 92 und 93: 90 DAGA 2012 ProgrammDi. 17:20 vana
- Seite 94 und 95: 92 DAGA 2012 Programm∂ np + δ∂
- Seite 96 und 97: 94 DAGA 2012 ProgrammDi. 14:25 tita
- Seite 98 und 99: 96 DAGA 2012 Programmvorwärtsgesic
- Seite 100 und 101: 98 DAGA 2012 Programmdie Möglichke
- Seite 102 und 103: 100 DAGA 2012 ProgrammDi. 14:25 pal
- Seite 104 und 105: 102 DAGA 2012 Programmwerden Daten
- Seite 106 und 107: 104 DAGA 2012 ProgrammDi. 14:50 aur
- Seite 108 und 109: 106 DAGA 2012 ProgrammDi. 16:30 aur
- Seite 110 und 111: 108 DAGA 2012 Programmthreshold and
- Seite 112 und 113: 110 DAGA 2012 ProgrammIm Beitrag we
- Seite 114 und 115: 112 DAGA 2012 ProgrammDi. 15:15 has
- Seite 116 und 117: 114 DAGA 2012 ProgrammDienstag (bis
- Seite 118 und 119: 116 DAGA 2012 ProgrammAudiosignalen
- Seite 120 und 121: 118 DAGA 2012 Programmwichtige Roll
- Seite 122 und 123: 120 DAGA 2012 ProgrammDi. 17:45 ger
- Seite 124 und 125: 122 DAGA 2012 ProgrammRecognition (
- Seite 128 und 129: 126 DAGA 2012 ProgrammThe resulting
- Seite 130 und 131: 128 DAGA 2012 ProgrammSprachmerkmal
- Seite 132 und 133: 130 DAGA 2012 ProgrammDi. 15:15 neo
- Seite 134 und 135: 132 DAGA 2012 Programmverwendeten c
- Seite 136 und 137: 134 DAGA 2012 Programmwas built to
- Seite 138 und 139: 136 DAGA 2012 ProgrammDi. 15:15 hel
- Seite 140 und 141: 138 DAGA 2012 Programmder Akustikso
- Seite 142 und 143: 140 DAGA 2012 ProgrammMi. 9:20 Spec
- Seite 144 und 145: 142 DAGA 2012 ProgrammAuswertung de
- Seite 146 und 147: 144 DAGA 2012 ProgrammDazu wird ein
- Seite 148 und 149: 146 DAGA 2012 Programmauch die Krä
- Seite 150 und 151: 148 DAGA 2012 ProgrammMittwoch (ab
- Seite 152 und 153: 150 DAGA 2012 Programmeinen faserve
- Seite 154 und 155: 152 DAGA 2012 Programmüber kleine
- Seite 156 und 157: 154 DAGA 2012 ProgrammMi. 16:30 Spe
- Seite 158 und 159: 156 DAGA 2012 Programmsich auch auf
- Seite 160 und 161: 158 DAGA 2012 Programmder Flankenü
- Seite 162 und 163: 160 DAGA 2012 Programmzum Körpersc
- Seite 164 und 165: 162 DAGA 2012 ProgrammMi. 15:15 Spe
- Seite 166 und 167: 164 DAGA 2012 ProgrammWohnen” deu
- Seite 168 und 169: 166 DAGA 2012 ProgrammSitzung „Vi
- Seite 170 und 171: 168 DAGA 2012 ProgrammMi. 9:45 chro
- Seite 172 und 173: 170 DAGA 2012 ProgrammMi. 14:50 chr
- Seite 174 und 175: 172 DAGA 2012 Programmentwickelten
124 <strong>DAGA</strong> <strong>2012</strong> ProgrammDi. 16:30 radon 3.05 SprachverarbeitungMethoden zur indirekten Bewertung der Qualitätswahrnehmungasynchroner audiovisueller SpracheS. WilsonDeutsche Telekom Laboratories, TU BerlinDie Qualitätswahrnehmung audiovisueller Sprache ist eine wichtigerEinflussgröße hinsichtlich der Akzeptanz sprachbasierter multimodalerSystemen. Einer der möglichen Faktoren ist dabei die Asynchronität zwischenTon und Bild, welche sowohl auf die Qualität als auch die Akzeptanzeines Systems einwirken kann. Dieser Beitrag stellt ein Frameworkvor, welches darauf abzielt, mittels indirekter Methoden eine automatischeBewertung der wahrgenommenen Qualität und der Akzeptanzasynchroner Sprache vorzunehmen. Ergebnisse von Experimentenbezüglich der direkten Bewertung von asynchroner Sprache werdenberichtet. Weiterhin wird ein statistisches Verfahren zur Detektionvon Asynchronität anhand automatisch erzeugter audiovisueller Merkmalebeschrieben. Abschließend wird ein statistisches Modell zur indirektenBewertung wahrgenommener Qualität vorgestellt, basierend aufden verallgemeinerten trainierten Verbindungen zwischen der automatischengemessenen Asynchronität und der direkt, experimentell gemessenenWahrnehmung davon.Di. 16:55 radon 3.05 SprachverarbeitungCodebook-based Bandwidth Extension with Side-InformationJ. Freudenberger und M. MüllerHTWG KonstanzArtificial bandwidth extension techniques can enhance the quality of narrowbandspeech transmission, but may cause artifacts with noisy speechsignals. This work presents a speech transmission technique usingbandwidth extension with side information for A-law encoded speech signals.A-law companding is standardized in the ITU-T G.711 standardand used in telecommunication systems like ISDN networks or the Bluetoothspeech link. The approach by Heping Ding requires 24 bits of sideinformation for each speech frame. The new codebook based approachrequires at most 12 bits of side information per 20 ms speech frame.Embedding a small number of bits as side information in the least significantbit position results in almost inaudible distortions. Hence, it ensuresbackwards compatibility for ordinary receivers without BWE decoder.The presented approach improves the speech quality for noise free andnoisy speech signals compared to a narrowband transmission and toartificial bandwidth extension. The speech quality has been evaluatedby means of instrumental quality measures as well as informal listeningtests with 20 persons.