統計モデルを用いた音源方向推定 Estimation of sound source direction using statistical model

この論文をさがす

著者

抄録

バイノーラル信号とは,聴取者の頭部や耳介における反射・回折の特性が含まれた2チャネル信号である.バイノーラル信号の周波数特性に含まれる方向情報を利用することで,音源方向推定が可能なロボットへの応用が可能であると考えられる.そこで本報告では,反射波が含まれる実環境において,バイノーラル信号による音源方向推定が可能なシステムの構築を目指す.方向を識別するための特徴量として,両時間音圧差(ILD: Interaural Level Difference)の包終に注目し,混合ガウスモデル(GMM: Gaussian Mixture Model)を用いた音源方向推定モデルを構築し,音源方向推定実験により評価した.方位角を30°間隔とし,呈示音源として標本化周波数48kHzの白色雑音とHSL雑音(Human speech like noise)を用いた場合,正解率はそれぞれ最大で100%, 99.5%であった.残響時間が異なる環境のデータを用いて評価した場合も,正解率はほぼ一定の値を示した.

A binaural sound is one of stereo sound and includes characteristics of sound reflection and refraction at the head and ears. Using the frequency characteristic of binaural sound, robot can detect the sound source direction. In this study, we propose the detection method of sound source direction with binaural sound in reverberant environments. This method uses an envelope of interaural level difference and detects the direction of sound source with Gaussian mixture model (GMM). At 30°intervals, the detection model with GMM achieved 99.5% accuracy in white noise and 100% accuracy in Human speech like noise in the case of 48kHz sampling rate. This proposed method obtained the same accuracy rate during various reverberation time.

収録刊行物

  • 電子情報通信学会技術研究報告. EA, 応用音響

    電子情報通信学会技術研究報告. EA, 応用音響 105(651), 23-28, 2006-03-13

    一般社団法人電子情報通信学会

参考文献:  13件中 1-13件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    110004690831
  • NII書誌ID(NCID)
    AN10164817
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    7878995
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS 
ページトップへ