10.07.2015 Views

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

室 内 雑 音 環 境 下 で 2 人 の 人 物 が 異 なる 方 向 から 同 時発 声 したときのストリーム 追 跡 結 果 である。0~4 番までの 5 つのストリームが 追 跡 により 検 出 されている。このうち、1 番 と 3 番 が 正 解 、0 番 と 4 番 が 背 景での 人 の 話 し 声 、2 番 が 偽 のストリームである。なお、 音 源 が 大 きく 移 動 しないと 仮 定 すれば、ストリームを 構 成 する 各 時 刻 の 直 線 群 によるθを 平 均したものをストリームのθとすることができる。を 使 ったときの 音 源 定 位 の 概 念 を 示 した 図 である。各 マイク 対 から 得 られた 音 源 方 向 φ1 とφ2 について最 小 二 乗 誤 差 となるドーム 上 の 仮 想 音 源 を 探 索 する。Fig.9 Principle of sound source localization with φ1and φ2Fig.8 An experimental result of stream tracking2.9. 成 分 推 定 とストリーム 照 合以 上 で 説 明 した 処 理 は、1 つのマイク 対 においてそれぞれ 実 行 される 処 理 である。ロボットは 複 数 のマイク 対 を 実 現 できるので、マイク 対 をまたぐ 処 理 によって、さらに 音 源 についての 情 報 を 得 ることができる。異 なるマイク 対 で 検 出 されたストリームでも、 同一 音 源 に 由 来 する 限 り、その 継 続 期 間 と 周 波 数 成 分は 似 ているはずである。 既 に 述 べたように、 各 マイク 対 で 検 出 される 音 源 の 主 な 周 波 数 成 分 は、その 証拠 となった 直 線 群 の 近 傍 に 分 布 するプロット 図 上 の点 を 選 別 することで 推 定 することができる。このように 音 源 の 周 波 数 成 分 を 粗 く 推 定 し、 推 定 された 周波 数 成 分 を 例 えば 単 純 類 似 度 法 などで 比 較 照 合 することで、あるマイク 対 のある 直 線 群 が、 別 のマイク対 のどの 直 線 群 と 似 ているかを 評 価 することができる。ストリーム 照 合 は、 推 定 された 音 源 の 周 波 数 成 分と 継 続 期 間 を 評 価 することで、 同 時 期 に 似 た 周 波 数成 分 を 持 っている 音 源 をマイク 対 間 で 対 応 付 ける 処理 である。 対 応 付 けられるべき 相 手 が 見 つからないストリームはノイズとして 削 除 される。2.10. 音 源 定 位ストリーム 照 合 によって 対 応 付 けられたストリームは、 各 マイク 対 に 対 する 音 源 方 向 φ(θから 計 算 )を、 対 応 付 けられたマイク 対 の 数 だけ 持 っている。これをマイク 対 の 数 n を 使 って 表 すと、 音 源 方 向 情報 ={φ1…φn}となる。この 集 合 は、ある 空 間 位 置にある 音 源 が、それぞれのマイク 対 から 見 てどの 方向 にあるかを 示 したデータである。そこで、ロボットを 中 心 に 仮 想 的 なドームを 考 え、そのドーム 表 面に 適 度 な 間 隔 で 離 散 した 仮 想 的 な 音 源 を 配 置 し、 各仮 想 音 源 が 各 マイク 対 のどの 方 向 にあるかを 予 め 計算 してテーブル 化 しておく。Fig.9 は 2 つのマイク 対3. 動 作 確 認 実 験3.1. システム 構 成2 章 で 説 明 した 処 理 によって 全 方 位 聴 覚 を 実 現 するシステム 構 成 を Fig.10 に 示 す。Fig.10 System block diagramロボットは Mic1~6 の 6 つのマイクを 装 備 している。システムは 1 つの 音 源 推 定 プロセスと 最 大 6 つの 音 声 認 識 プロセスとで 構 成 されており、プロセス間 は 共 有 メモリで 結 ばれている。 音 源 推 定 プロセスは 前 述 した 音 響 信 号 処 理 を 行 って、 各 マイク 対 に 対する 音 源 数 と 方 向 の 推 定 処 理 と、 複 数 のマイク 対 を使 った 音 源 の 空 間 定 位 処 理 を 行 う。 音 声 認 識 プロセスは 認 識 エンジンの 前 段 に 適 応 アレイ 処 理 を 配 したプロセスであり、マイク 対 に 対 する 音 源 の 方 向 φを使 って 適 応 アレイの 追 従 範 囲 を 設 定 し、 音 源 音 の 抽出 と 抽 出 された 音 声 の 認 識 を 行 う。 音 声 認 識 プロセスは 音 源 推 定 プロセスによって 方 向 の 異 なる 音 源 毎に 処 理 対 象 を 割 り 当 てられて 認 識 を 実 行 する。マイクからの 音 響 信 号 は 新 開 発 のメディア 処 理 ボード(MFeP2)によって 全 チャンネル 同 期 取 り 込 みがされるため、ローカルピーク 探 索 時 には 原 点 を 通 る 直線 群 ( 基 準 直 線 とその 循 環 延 長 線 )を 探 索 すればよい。3.2. 処 理 の 流 れ57

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!