10.07.2015 Views

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ロボットと 一 人 の 話 者 との 対 話 を 前 提 としたものであり, 対 話 制 御 の 対 象 としたものは,ロボット 本 体の 簡 単 な 動 作 と 情 報 家 電 の 制 御 であった.しかしながら, 我 々の 日 常 生 活 環 境 では, 複 数 のユーザとロボットとの 対 話 のような 場 面 が 用 意 に 考 えられ,そのような 場 面 では,ユーザ 同 士 の 会 話 にロボットが反 応 し, 誤 動 作 を 起 こす 可 能 性 がある. 今 後 は, 現在 使 用 している 画 像 処 理 部 分 に,ユーザの 視 線 や 顔の 方 向 検 出 を 導 入 し,より 詳 細 な 対 話 制 御 を 行 うように,ロボット 内 の 計 算 資 源 の 拡 張 を 含 めたシステムの 拡 張 をおこなう.また, 音 声 認 識 の 失 敗 による誤 動 作 を 修 正 するために, 緊 急 時 対 応 の 音 声 コマンドの 導 入 を 進 めていく 予 定 である.参 考 文 献1) http://www.nedo.go.jp/roadmap/index.html2) K.Nakadai,K.Hidai,H.Mizoguchi, H.G.Okuno andH.Kitano, “Real-Time Auditory and Visual Mutiple-ObjectTracking for Humanoid”, Proc of IJCAI2001, pp1424-1432,2001.3) http://www.incx.nec.co.jp/robot/4) 松 日 楽 信 人 , 小 川 英 樹 , 吉 見 卓 ,” 人 と 共 存 する 生 活 ロボット”, 東 芝 レビュー, Vol.60,No.7, pp112-115,20055) http://www.hqrt.hitachi.co.jp/merl/robot/6) F. Asano, K. Yamamoto, I. Hara, J. Ogata, T. Yoshimura,Y. Motomura, N. Ichimura and H. Asoh,: “Detection andSeparation of Speech EventUsing Audio and Video InformationFusion and Its Application to Robust Speech Interface",Eurasip Journal on Applied Signal Processing, 2004,11, pp.1727-1738 ,2004.7) I. Hara, F. Asano, H. Asoh, J. Ogata, N. Ichimura, Y.Kawai, F. Kanehiro, H. Hirukawa and K. Yamamoto:“Robust Speech Interface Based on Audioand Video InformationFusion for Humanoid HRP-2",Proc. of IROS2004, pp. 2404-2410. 2004.8) K. Yamamoto, F. Asano, I. Hara, J. Ogata, M. Goto, H.Furukawa, T. Kamashima and N. Kitawaki,: “Real-timeImplementation and Evaluation of Speech Event Detectionand SeparationBased on the Fusion of Audio and VideoInformation", Proc.s of GSPx 2004 , 2004.9) M. Goto, R. Neyama and Y. Muraoka,: “RMCP:RemoteMusic Control Protocol | Design and Applications |", Proc.of the 1997 Int. Computer Music Conference, pp.446-449 ,1997.10) F. Asano, Y. Motomura, H. Asoh, T. Yoshimura,N. Ichimuraand S. Nakamura: “Fusion of Audio and Video Informationfor Detecting Speech Event", Proce. of Fusion2003, pp. 386-393, 2003.11) D. Comaniciu, V. Ramesh and P. Meer: “Kernel-based objecttracking", IEEE Trans. on Pattern Analysis MachineIntelligence, 25, 5, pp. 564-575,2003.12) D. H. Johnson and D. E. Dudgeon,: Array Signal Processing,Prentice Hall, 1993.13) 河 原 達 也 , 李 晃 伸 :” 連 続 音 声 認 識 ソフトウエア Julius”,人 工 知 能 学 会 誌 , Vol.20, No.1, pp.41-49, 2005.14) C.J. Leggetter and P. C. Woodland, “Maximum likelihoodlinear regression for speaker adaptation of continuous densityhidden Markov models", Computer Speech and Language,9, 2, pp. 171-185 ,1995.15) J. L. Gauvain and C. H. Lee, “Maximum a posteriori estimationfor multivariate Gaussian mixture observations ofMarkov chains", IEEE Transactions on Speech and AudioProcessing, 2, 2, pp. 291-298.1994.16) E. Thelen, X. Aubert and P. Beyerlein: “SpeakerAdaptationin the Philips System for Large Vocabulary ContinuousSpeech Recognition", Proc. of ICASSP '97, pp.1035-1038 ,1997.17) 河 原 達 也 , 武 田 一 哉 , 伊 藤 克 亘 , 李 晃 伸 , 鹿 野 清 宏 , 山田 篤 :” 連 続 音 声 認 識 コンソーシアムの 活 動 報 告 及 び 最終 版 ソフトウェアの 概 要 ", SP2003-169, NLC2003-106(SLP-49-57), 電 子 情 報 通 信 学 会 技 術 研 究 報 告 , 2003.88

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!