10.07.2015 Views

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

社 団 法 人 人 工 知 能 学 会Japanese Society forArtificial Intelligence人 工 知 能 学 会JSAI Technical ReportSIG-CHallege-0522-7 (10/14)パーソナルロボット PaPeRo における 近 接 話 者 方 向 推 定 と 2 マイク 音 声 強 調Near-Field Sound-Source Localization and Adaptive Noise Cancellationin a Personal Robot, PaPeRoAbstract—This paper presents implementation andevaluation of speech interface for a personal robot,PaPeRo, based on sound-source localization and noisecancellation. Sound-source localization incorporates anew formula taking near-field conditions into account foroffsetting errors caused by the relative altitude of thespeech source to the microphones. In noise cancellation,a novel stepsize control assuming a wide range of signal-to-noiseratios of the input signal helps achieve bothsmall residual noise and distortion in the noise-cancelledsignal. Evaluation results with recorded signals in thereal environment demonstrates 40% highersource-localization performance and as much as 65%higher speech recognition rates in noisy environment.1. はじめに〇 佐 藤 幹 (NEC メディア 情 報 研 究 所 )杉 山 昭 彦 (NEC メディア 情 報 研 究 所 )大 中 慎 一 (NEC メディア 情 報 研 究 所 )* Miki SATO(NEC.), Akihiko SUGIYAMA(NEC.), Shin’ichi Ohnaka(NEC.)m-sato@dh.jp.nec.com, aks@ak.jp.nec.com, s-ohnaka@cp.jp.nec.com近 年 、 人 間 と 共 生 することを 目 的 としたパートナー 型 ロボットの 研 究 が 盛 んに 行 われている [1]。これらのロボットは、 通 常 、 音 声 コマンドによって、離 れた 位 置 から 制 御 される。 背 景 雑 音 や 妨 害 信 号 の影 響 を 低 減 して、 正 確 に 音 声 コマンドを 認 識 するために、 指 向 性 マイクロホンが 広 く 使 われている。このため、 音 声 の 到 来 する 方 向 を 推 定 し、 推 定 方 向 にマイクロホンの 指 向 性 を 一 致 させることが 重 要 となる。遠 隔 会 議 などの 通 信 応 用 と 異 なり、 人 間 とロボットの 対 話 では、 話 者 の 口 、すなわち 音 源 とマイクロホンは、 同 一 平 面 上 にあると 見 なすことはできない。しかし、ロボットにおける 話 者 方 向 推 定 では、 暗 黙のうちに 音 源 とマイクロホンが 同 一 平 面 上 にあると仮 定 してきた。この 仮 定 が 話 者 方 向 推 定 結 果 に 与 える 影 響 は、 人 間 とロボットとの 距 離 が 近 くなるほど大 きくなる。すなわち、 近 接 音 場 を 想 定 した 方 向 推定 が 重 要 となるのである。一 方 、マイクロホンの 指 向 性 だけで 抑 圧 できない雑 音 や 妨 害 信 号 は、 音 声 強 調 処 理 によって、その 影響 を 軽 減 する。 応 用 毎 に 異 なる 要 求 条 件 に 応 じて、1つ 又 は 多 数 のマイクロホンを 用 いた 雑 音 及 び 妨 害 信号 の 抑 圧 が、 広 く 行 われている [2]。 人 間 とロボットの 対 話 においては、2 つのマイクロホンを 用 いた適 応 ノイズキャンセラが、マイクロホン 数 、 雑 音 除去 性 能 、 及 び 歪 の 観 点 から 見 て、 良 い 妥 協 策 である。適 応 ノイズキャンセラは、 音 声 用 と 雑 音 用 の 2 つFigure. 1: PaPeRo の 外 観のマイクロホンを 用 いて、 雑 音 の 消 去 を 行 う。 符 号化 や 音 声 認 識 の 前 処 理 に 用 いるために、 係 数 更 新 ステップサイズを 音 声 対 雑 音 比 (SN 比 )に 応 じて 制 御することで、 高 い 雑 音 消 去 性 能 と 小 さな 音 声 歪 を 両立 することができるノイズキャンセラ [3] が 提 案されている。このノイズキャンセラは、ヘッドセットなどのように、 音 声 用 マイクロホンが 話 者 の 口 元にあることを 想 定 しているため、 様 々な 距 離 から 話しかけられるロボットに 適 用 することはできない。音 声 用 マイクロホンと 口 との 距 離 に 応 じて、SN 比 が広 範 囲 に 変 化 するためである。本 稿 では、 音 声 対 話 機 能 をもつ 自 律 移 動 型 パーソナルロボット PaPeRo[4]における、 近 接 音 場 を 想 定した 話 者 方 向 推 定 と、 広 範 囲 な SN 比 に 対 応 できるノイズキャンセラについて 紹 介 する。2 節 で、PaPeRoの 構 成 と 音 声 インタフェースについて 説 明 する。3節 では 近 接 話 者 方 向 推 定 、4 節 ではノイズキャンセラをとりあげる。5 節 では 評 価 結 果 を 用 いて 性 能 を明 らかにし、6 節 で 今 後 の 課 題 について 述 べる。2. パーソナルロボット PaPeRo2.1. ハードウェアパーソナルロボットPaPeRoの 外 観 を、Fig. 1に 示 す。PaPeRoは、 高 さ385mm、 幅 248mm、 奥 行 245mm、重 量 5.0kgの 自 律 移 動 型 ロボットである。 胴 体 正 面 に4 個 、 左 右 にそれぞれ1 個 、 背 面 に1 個 の 無 指 向 性41

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!