10.07.2015 Views

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

第22回 ロボット聴覚特集 - 奥乃研究室 - 京都大学

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ている。図 中 (b)は、マイク 対 の 正 面 から 発 声 したときの結 果 を 表 したものであり、 位 相 差 スペクトルは 回 転せずに 0 付 近 ( 赤 色 )に 留 まっている。図 中 (c)は、マイク 対 の 左 から 発 声 したときの 結果 を 示 したものである。 位 相 差 は 周 波 数 の 高 い 領 域に 行 くにつれて 赤 紫 色 から 橙 色 へ 変 化 するグラデーション、すなわち 色 円 環 上 で(a)の 逆 方 向 への 回 転を 示 している。いずれの 場 合 も 音 源 は 移 動 していないため、 周 波数 成 分 毎 の 位 相 差 は 時 間 軸 方 向 でほぼ 一 定 に 安 定 している。すなわち、 位 相 差 スペクトルは 音 源 の 方 向を 知 るための 情 報 として 信 頼 できる。そして、この位 相 差 スペクトルの 各 周 波 数 成 分 値 ΔPh は 前 述 の 直線 の 傾 きθから 式 3 によって 知 ることができる。なお、 位 相 差 ΔPh が 負 値 となるとき、θは 正 値 となる。そのために、θの 符 号 を 反 転 させている。ΔPh(θ, f)=f・tan(-θ) ・・・( 式 3)2.4. ρ=0 の 制 約マイク 1 と 2 の 信 号 が 同 相 で A/D 変 換 される 場 合 、検 出 されるべき 直 線 は 必 ずρ=0、すなわち XY 座 標系 の 原 点 を 通 る。したがって、 音 源 の 推 定 問 題 は、ハフ 投 票 バッファ 上 の 得 票 分 布 S(θ,ρ)でρ=0 となるθ 軸 上 の 1 次 元 の 得 票 分 布 S(θ,0)からローカルピークを 探 索 する 問 題 に 帰 着 する。Fig.5 に 実 際 の 単 独 発 話 音 声 を 使 って 直 線 を 検 出 した 例 を 示 す。この 例 は、 室 内 雑 音 環 境 下 で 1 人 の 人物 がマイク 対 の 正 面 約 20 度 左 から 発 話 した 実 際 の 音声 を 用 いて 処 理 した 結 果 である。 図 中 にマイク 1 と 2のパワースペクトル 及 び 位 相 差 スペクトル(a)、 図中 (b)に FFT 結 果 から 得 た 周 波 数 成 分 毎 の 位 相 差 プロット 図 を、 図 中 (c)に 位 相 差 プロット 図 から 得 たハフ 投 票 結 果 を、 図 中 (d)にρ=0 上 の 得 票 分 布 を、図 中 (e)に 検 出 されたローカルピーク( 直 線 候 補 )を、 図 中 (f)に 得 票 1 位 のピークをプロット 図 上 に描 画 した 直 線 ( 赤 )をそれぞれ 示 す。マイク 対 で 取 得 された 音 声 は、 周 波 数 成 分 毎 のパワー 値 と 位 相 値 のデータに 変 換 される。これを 受 けて、 周 波 数 成 分 毎 の 位 相 差 が 求 められ、その(x,y)座 標 値 が 算 出 される。この 座 標 値 の 集 合 をプロットした 図 を 確 認 すると、 原 点 から 左 に 傾 いた 直 線 に 沿う 点 群 分 布 が 認 められる。このような 分 布 を 示 している 各 点 の(θ,ρ) 軌 跡 がハフ 投 票 バッファに 投 票 されて 得 票 分 布 S(θ,ρ)を 形 成 する。θ 軸 上 の 得 票 分 布 S(θ,0)を H(θ)として 抜 き 出 して 棒 グラフにしたものが 図 中 (d)である。この 得 票分 布 H(θ)には 幾 つか 極 大 部 が 存 在 している。 図 中(e)にローカルピークの 探 索 結 果 を 示 す。このようにすることで 十 分 な 得 票 を 得 た 直 線 のθを 割 り 出 すことができる。この 例 では、 検 出 された 4 つのピークのうち、 閾 値 処 理 によって 1 位 のみが 検 出 されている。Fig.5 An experimental result of line detection with ρ=0 constraint in a case of single speaker2.5. 位 相 差 の 循 環 性ところで、 両 マイク 間 の 位 相 差 ΔPh(f)が Fig.2 に 示したように 全 域 で 周 波 数 に 比 例 するのは、 解 析 対 象となる 最 低 周 波 数 から 最 高 周 波 数 まで 通 して 真 の 位相 差 が±πを 逸 脱 しない 場 合 に 限 られる。この 条 件はΔT が、 最 高 周 波 数 Fr/2[Hz](サンプリング 周 波 数Fr の 半 分 )の 1/2 周 期 分 の 時 間 、すなわち 1/Fr[ 秒 ]以 上 とならないことである。もし、ΔT が 1/Fr 以 上となる 場 合 には、 次 に 述 べるように 位 相 差 が 循 環 性を 持 つ 値 としてしか 得 られないことを 考 慮 しなければならない。手 に 入 れることのできる 周 波 数 成 分 毎 の 位 相 値 は例 えば-πからπの 間 というように 2πの 幅 でしか得 ることができない。これはその 周 波 数 成 分 における 実 際 の 位 相 差 が 両 マイク 間 で 1 周 期 以 上 開 いていても、データとして 得 られる 位 相 角 からそれを 知 ることができないことを 意 味 する。 要 するに、ΔT に起 因 する 真 の 位 相 差 は、データとして 得 られた 位 相差 の±2πや、さらに±4πや±6πの 値 である 可 能 性がある。これを 模 式 的 に 示 すと Fig.6 のようになる。図 中 の○がΔT を 同 じくする 真 の 位 相 差 だが、 観 測されるのは 左 に 2π 平 行 移 動 して 現 れる●となる。Fig.6 Circulation of phase differenceρ=0 の 制 約 では 原 点 を 通 る 直 線 のみを 探 すことになるので、このように 2πの 剰 余 系 として 循 環 した 位置 に 現 れる 点 群 をカウントしていない。これは 傾 きの 大 きな 直 線 ほど 得 票 で 不 利 になることを 意 味 している。そのことは Fig.5(d)に 示 した 得 票 分 布 にお55

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!