- 8 -
社 団 法 人 人 工 知 能 学 会Japanese Society forArtificial Intelligence人 工 知 能 学 会 研 究 資 料JSAI Technical ReportSig-Challenge-0522-2 (10/14)SIMO-ICA Sound Scene Decomposition for Audio Tele-Presence Using SIMO-ICA, , Tomoya TAKATANI, Hiroshi SARUWATARI, Kiyohiro SHIKANO Nara Institute of Science and Technology, Graduate School of Information Science{tomoya-t, sawatari, shikano}@is.naist.jphttp://www.aist-nara.ac.jp/ ∼ tomoya-t/index.htmlAbstractIn this paper, we address a blind decompositionproblem of binaural mixed signals observed atthe ears of humanoid robot, and we introduce anovel blind signal decomposition algorithm usingSingle-Input Multiple-Output-model-basedICA (SIMO-ICA). The SIMO-ICA consists ofmultiple ICAs and a fidelity controller, andeach ICA runs in parallel under the fidelitycontrol of the entire separation system. TheSIMO-ICA can separate the mixed signals, notinto monaural source signals but into SIMOmodel-basedsignals from independent sourcesas they are at the microphones in the robotear. Thus, the separated signals of SIMO-ICAcan maintain the spatial qualities of each soundsource, i.e., they represent the decomposedsound scenes. Obviously the attractive featureof SIMO-ICA is highly applicable to not onlyspeech recognition but also, e.g., humanoidrobot-basedauditory tele-existence technology.The experimental results reveal that the spatialquality of the separated sound in SIMO-ICAis remarkably superior to that of the conventionalmethod, particularly for the fidelity ofthe sound reproduction.1 (BSS) (ICA)[1] BSS [2,3,4]. , . [5], [6], tele-presence (tele-existence)[7, 8] ., Single-Input Multiple-Output(SIMO) SIMO ICA (SIMO-ICA) [9, 10, 11, 12] , SIMOSIMO SIMO SIMO-ICA ICA fidelitycontroller , ICA . SIMO-ICA , SIMO , SIMO-ICA , . 1 SIMO-ICA MINT [13] 2 SIMO-ICA [14] 3 SIMO-ICA [15]9
- Page 4: SCOT(Smoothed Coherence Transform)P
- Page 8 and 9: Particle (a)(b)φ12(τ )[14]x ( t )
- Page 12 and 13: 1 () 2 SIMO-ICA 3 SIMO-ICA tele
- Page 14: ICAy FCy FCy SIMO-ICAs 1(t)x 1(t)1(
- Page 17 and 18: [15] Y. Mori, H. Saruwatari, T. Tak
- Page 19 and 20: 社 団 法 人 人 工 知 能 学
- Page 21 and 22: • 音 源 位 置マイク配 置
- Page 23 and 24: Table 1: 6 : SIR (dB)SIR 1 SIR 2 S
- Page 25 and 26: 社 団 法 人 人 工 知 能 学
- Page 27 and 28: SIMO-ICA SIMO Figure 2(a)SIMO-ICA
- Page 29 and 30: Binary maskConventional ICAConventi
- Page 31 and 32: 社 団 法 人 人 工 知 能 学
- Page 33 and 34: k lo (l), k c (l), k hi (l) l k c
- Page 35 and 36: 5.75 m4.33 mNoise1.15 mUser 40°2.1
- Page 38 and 39: おける 方 法 論 に 関 し
- Page 40 and 41: Fig.6 は 幼 児 の ABR (Auditory
- Page 42 and 43: ンターフェースはスパイ
- Page 44 and 45: マイクロホン[ 正 面 ][ 左
- Page 46 and 47: s(k)Crosstalkn(k)R S(k)X P(k)X R(k)
- Page 48 and 49: する 隠 れマルコフモデル
- Page 50 and 51: 123ÙÖ ½ ¾º¾ ´º ½µ ´º
- Page 52 and 53: ÌÐ ½ ¿º¾ ÅÎÆÇÂ
- Page 54 and 55: ÁÒØÖÒØÓÒÐ ÓÒÖÒ ÓÒ Á
- Page 56 and 57: 例 えば、 同 一 時 間 差
- Page 58 and 59: いて、θの 絶 対 値 が 大
- Page 60 and 61:
Fig.11 にこのシステムの 処
- Page 62 and 63:
5 , 2 EMIEWFig.1 EMIEW EMIEW 6 ,
- Page 64:
0 P th , (14) 4.4 3 4 4 1 , 3
- Page 67 and 68:
社 団 法 人 人 工 知 能 学
- Page 69 and 70:
3.1. 3.2. Fig. 3. The
- Page 71 and 72:
4.1. Fig. 5. The time co
- Page 73 and 74:
社 団 法 人 人 工 知 能 学
- Page 75 and 76:
modal (m, ), whispery (w, ), aspir
- Page 77 and 78:
Aperiodicity rate (APR)TLR (Time-La
- Page 79 and 80:
社 団 法 人 人 工 知 能 学
- Page 81 and 82:
, À, WDS-BF Ñ À℄·
- Page 83 and 84:
Table 1: Localization Error of A Si
- Page 85 and 86:
社 団 法 人 人 工 知 能 学
- Page 87 and 88:
を 行 い, 閾 値 処 理 を
- Page 89 and 90:
4. 音 声 対 話 制 御 実 験H
- Page 91 and 92:
社 団 法 人 人 工 知 能 学
- Page 93 and 94:
3 HLDAMLLR [3] (Useful Information
- Page 95 and 96:
Class 10degClass 20degClass 10degCl
- Page 97 and 98:
社 団 法 人 人 工 知 能 学
- Page 99 and 100:
赤 い 長 方 形 内 ). 以 下
- Page 101 and 102:
5.2 音 場 計 測 結 果(dB SPL)
- Page 103 and 104:
社 団 法 人 人 工 知 能 学
- Page 105 and 106:
a) 90 b) 90 MFMc) d) MFMe) 9
- Page 107 and 108:
(3) MFT Julius 7.1 Figure 4: SIG2