PROGRAMM - DAGA 2012

PROGRAMM - DAGA 2012 PROGRAMM - DAGA 2012

dega.akustik.de
von dega.akustik.de Mehr von diesem Publisher
13.07.2015 Aufrufe

124 DAGA 2012 ProgrammDi. 16:30 radon 3.05 SprachverarbeitungMethoden zur indirekten Bewertung der Qualitätswahrnehmungasynchroner audiovisueller SpracheS. WilsonDeutsche Telekom Laboratories, TU BerlinDie Qualitätswahrnehmung audiovisueller Sprache ist eine wichtigerEinflussgröße hinsichtlich der Akzeptanz sprachbasierter multimodalerSystemen. Einer der möglichen Faktoren ist dabei die Asynchronität zwischenTon und Bild, welche sowohl auf die Qualität als auch die Akzeptanzeines Systems einwirken kann. Dieser Beitrag stellt ein Frameworkvor, welches darauf abzielt, mittels indirekter Methoden eine automatischeBewertung der wahrgenommenen Qualität und der Akzeptanzasynchroner Sprache vorzunehmen. Ergebnisse von Experimentenbezüglich der direkten Bewertung von asynchroner Sprache werdenberichtet. Weiterhin wird ein statistisches Verfahren zur Detektionvon Asynchronität anhand automatisch erzeugter audiovisueller Merkmalebeschrieben. Abschließend wird ein statistisches Modell zur indirektenBewertung wahrgenommener Qualität vorgestellt, basierend aufden verallgemeinerten trainierten Verbindungen zwischen der automatischengemessenen Asynchronität und der direkt, experimentell gemessenenWahrnehmung davon.Di. 16:55 radon 3.05 SprachverarbeitungCodebook-based Bandwidth Extension with Side-InformationJ. Freudenberger und M. MüllerHTWG KonstanzArtificial bandwidth extension techniques can enhance the quality of narrowbandspeech transmission, but may cause artifacts with noisy speechsignals. This work presents a speech transmission technique usingbandwidth extension with side information for A-law encoded speech signals.A-law companding is standardized in the ITU-T G.711 standardand used in telecommunication systems like ISDN networks or the Bluetoothspeech link. The approach by Heping Ding requires 24 bits of sideinformation for each speech frame. The new codebook based approachrequires at most 12 bits of side information per 20 ms speech frame.Embedding a small number of bits as side information in the least significantbit position results in almost inaudible distortions. Hence, it ensuresbackwards compatibility for ordinary receivers without BWE decoder.The presented approach improves the speech quality for noise free andnoisy speech signals compared to a narrowband transmission and toartificial bandwidth extension. The speech quality has been evaluatedby means of instrumental quality measures as well as informal listeningtests with 20 persons.

Programm DAGA 2012 125Di. 17:20 radon 3.05 SprachverarbeitungInstrumental Musical Tones Measurement of Arbitrary Noise ReductionSystemsH. Yu und T. FingscheidtTU Braunschweig, Institut für NachrichtentechnikInstrumental measurement of noise reduction systems has to deal withseveral aspects such as the speech component quality, the level of noiseattenuation, and noise distortion in terms of musical tones. Severalmethods exist already for the first two aspects, while the instrumentalmeasurement of musical tones still remains a challenging task. Recently,the exploration of the log-kurtosis ratio for instrumentally measuringmusical tones has led to white box test methodologies requiring specificinformation of the particular noise reduction algorithm. In this paper, anew instrumental musical tones measurement is proposed, which enablesmusical tones measurement with unknown noise reduction systemsin a black box test. The proposed instrumental measure has been verifiedby a subjective listening test.Di. 17:45 radon 3.05 SprachverarbeitungÜber ein neues Verfahren zur RückkopplungsreduzierungH. Pastillé und R. SehlmeyerIAV GmbHInnenraumkommunikationssysteme in Kraftfahrzeugen stoßen an ihreGrenzen, wenn es darum geht, die Sprachübertragung mit dem nötigenPegel auszustatten, um die spektrale Ergänzung umzusetzen. Die Systemegeraten leicht in die Rückkopplung, als Vorstufe klingt die Stimmeoft schon ”blechern”. Das hier vorgestellte Verfahren erlaubt eine Erhöhungder Verstärkung um durchschnittlich 2 dB. Als Einschränkung mussangemerkt werden, dass dieses Verfahren nur für Sprache tauglich ist.Di. 18:10 radon 3.05 SprachverarbeitungReference-free SNR Measurement for Speech in Car NoiseB. Fodor und T. FingscheidtTU Braunschweig, Institut für NachrichtentechnikSignal-to-noise (SNR) measurement of noisy speech signals is an importanttopic in automotive environments, e.g., for investigating optimalmicrophone positions. This contribution presents an SNR measurementmethod for speech signals distorted by car noise within a typical rangeof SNR values. The proposed method offers low complexity and aims atproviding similar results as SNR measurements based on active speechand noise levels obtained from ITU-T Recommendation P.56, however,in a reference-free fashion. ”Reference-free” means that the SNR is estimatedby means of only the noisy speech signal, i.e., no clean speechor noise reference signals are used. Within the measuring process, thespeech and noise power are estimated separately. The SNR is then calculatedas the ratio between the estimated speech and noise powers.

124 <strong>DAGA</strong> <strong>2012</strong> ProgrammDi. 16:30 radon 3.05 SprachverarbeitungMethoden zur indirekten Bewertung der Qualitätswahrnehmungasynchroner audiovisueller SpracheS. WilsonDeutsche Telekom Laboratories, TU BerlinDie Qualitätswahrnehmung audiovisueller Sprache ist eine wichtigerEinflussgröße hinsichtlich der Akzeptanz sprachbasierter multimodalerSystemen. Einer der möglichen Faktoren ist dabei die Asynchronität zwischenTon und Bild, welche sowohl auf die Qualität als auch die Akzeptanzeines Systems einwirken kann. Dieser Beitrag stellt ein Frameworkvor, welches darauf abzielt, mittels indirekter Methoden eine automatischeBewertung der wahrgenommenen Qualität und der Akzeptanzasynchroner Sprache vorzunehmen. Ergebnisse von Experimentenbezüglich der direkten Bewertung von asynchroner Sprache werdenberichtet. Weiterhin wird ein statistisches Verfahren zur Detektionvon Asynchronität anhand automatisch erzeugter audiovisueller Merkmalebeschrieben. Abschließend wird ein statistisches Modell zur indirektenBewertung wahrgenommener Qualität vorgestellt, basierend aufden verallgemeinerten trainierten Verbindungen zwischen der automatischengemessenen Asynchronität und der direkt, experimentell gemessenenWahrnehmung davon.Di. 16:55 radon 3.05 SprachverarbeitungCodebook-based Bandwidth Extension with Side-InformationJ. Freudenberger und M. MüllerHTWG KonstanzArtificial bandwidth extension techniques can enhance the quality of narrowbandspeech transmission, but may cause artifacts with noisy speechsignals. This work presents a speech transmission technique usingbandwidth extension with side information for A-law encoded speech signals.A-law companding is standardized in the ITU-T G.711 standardand used in telecommunication systems like ISDN networks or the Bluetoothspeech link. The approach by Heping Ding requires 24 bits of sideinformation for each speech frame. The new codebook based approachrequires at most 12 bits of side information per 20 ms speech frame.Embedding a small number of bits as side information in the least significantbit position results in almost inaudible distortions. Hence, it ensuresbackwards compatibility for ordinary receivers without BWE decoder.The presented approach improves the speech quality for noise free andnoisy speech signals compared to a narrowband transmission and toartificial bandwidth extension. The speech quality has been evaluatedby means of instrumental quality measures as well as informal listeningtests with 20 persons.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!