10.07.2015 Views

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Fig.11 にこのシステムの 処 理 の 流 れを 示 す。 音 声 は入 力 されると FFT 処 理 を 施 される。 入 力 音 声 からレベルによって 音 声 区 間 の 始 端 が 検 出 されると 終 端 検出 までの 間 が 音 声 区 間 とされ、ハフ 変 換 からストリーム 追 跡 までの 処 理 が 進 められる。 終 端 が 確 定 すると、ストリーム 照 合 以 降 の 処 理 が 実 行 されて、 認 識結 果 が 出 力 される。Mic5-6、Mic3-5、Mic4-6 の 4 組 を 使 用 した。 実 験 の結 果 、ロボットは 発 話 開 始 順 に 話 者 方 向 を 向 き、その 前 まで 移 動 して、 発 話 内 容 に 応 じた 応 答 音 声 を 出力 した。Fig.12 Demonstration of four sequential speakersFig.11 Flow diagram3.3. マイク 対 選 択 ・ 同 相 化 ・ 適 応 アレイ 処 理 ・ 音 声語 彙 認 識音 源 が 検 出 されると、 音 源 推 定 プロセスがその 音源 方 向 に 対 して 他 の 音 源 方 向 とかぶらないユニークなマイク 対 を 選 択 し、 音 声 認 識 プロセスがこのマイク 対 からの 入 力 音 声 を 認 識 する。 音 声 認 識 プロセス内 では、 選 択 されたマイク 対 からの 2ch 音 響 信 号 を同 相 化 することで、 音 源 があたかもマイク 対 の 正 面にあるかのような 信 号 を 生 成 する。このように 正 面向 きに 補 正 された 音 響 信 号 を 同 じく 正 面 向 きに 狭 追従 範 囲 を 与 えられた 適 応 アレイで 処 理 することで、適 応 アレイの 設 定 限 界 に 制 約 されることなく、どの方 向 からの 音 声 も 処 理 できるようにする。 適 応 アレイ 通 過 後 の 音 響 信 号 は 認 識 エンジンで 処 理 され、 得られた 認 識 結 果 は 共 有 メモリ 上 に 格 納 されて 利 用 される。3.4. 4 話 者 順 次 発 話 時 の 全 方 位 性 の 確 認以 上 の 処 理 を 実 装 して、4 人 の 話 者 が 順 に 発 話 したときの 音 源 定 位 ・ 音 声 認 識 実 験 を 行 った。Fig.12 に 実験 の 様 子 を 示 す。 発 話 内 容 は 4 種 類 で、 適 応 アレイの 追 従 範 囲 を±15 度 とし、マイクは Mic3~6 の 4 個 、マイク 対 は Mic3-4、Mic5-6、Mic3-5、Mic4-6 の 4 組を 使 用 した。 実 験 の 結 果 、ロボットは 発 話 順 に 話 者方 向 を 向 き、その 前 まで 移 動 して、 発 話 内 容 に 応 じた 応 答 音 声 を 出 力 した。3.5. 2 話 者 同 時 発 話 時 の 全 方 位 性 の 確 認2 人 の 話 者 がほぼ 同 時 に 発 話 したときの 音 源 定 位 ・音 声 認 識 実 験 を 行 った。Fig.13 に 実 験 の 様 子 を 示 す。発 話 内 容 は 2 種 類 で、 適 応 アレイの 追 従 範 囲 を±15度 とし、マイクは Mic3~6 の 4 個 、マイク 対 は Mic3-4、Fig.13 Demonstration of two simultaneous speakers4. おわりに本 稿 では、 家 庭 内 で 運 用 されるロボットにとって不 可 欠 と 思 われる 全 方 位 聴 覚 の 1 方 式 を 報 告 した。今 回 は 4 話 者 順 次 発 話 時 と 2 話 者 同 時 発 話 時 の 音源 定 位 と 音 声 語 彙 認 識 における 全 方 位 性 を 実 験 によって 確 認 するに 留 まったが、 提 案 方 式 が 機 能 し 得 ることを 検 証 することができた。なお、 本 開 発 は NEDO( 新 エネルギー・ 産 業 技 術 総合 開 発 機 構 ) 次 世 代 ロボット 実 用 化 プロジェクト(プロトタイプ 開 発 支 援 事 業 )に 採 択 され 実 施 したものであり、2005 年 愛 地 球 博 NEDO プロトタイプロボット 展 (6/9~6/19、モリゾー・キッコロメッセ)、および 常 設 展 (8/23~9/4、ロボットステーション)で 展示 実 演 を 行 った。そこで、 本 システムの 複 数 話 者 順次 発 話 対 応 機 能 を 実 演 したところ、80dB 程 度 の 周 囲雑 音 まで 動 作 可 能 であることを 確 認 している。参 考 文 献[1] 浅 野 太 ,“ 音 を 分 ける”, 計 測 と 制 御 , 第 43 巻 ,第 4 号 ,pp.325-330,Apr.2004[2] 中 臺 一 博 他 ,“ 視 聴 覚 情 報 の 階 層 的 統 合 による実 時 間 アクティブ 人 物 追 跡 ”, 工 知 能 学 会 AI チャレンジ 研 究 会 ,SIG-Challenge-0113-5,pp.35-42,Jun.2001[3] 岡 崎 彰 夫 ,“はじめての 画 像 処 理 ”, 工 業 調 査会 刊 ,Oct.200058

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!