2チャネル信号を用いた帯域分割-相互相関分析による音声認識

書誌事項

タイトル別名
  • Speech Recognition Using Binaural Subband-Crosscorrelation Analysis

この論文をさがす

抄録

帯域分割-相互相関分析法 (SBXCOR) は2入力信号の各サブバンド信号間の中心周波数の逆数 F^<-1>_<cf_i> に関する同期性を相互相関により抽出するbinaural音声分析手法である. 本報告では, まず, F^<-1>_<cf_i> の整数倍における相互相関をある定数αを用いた重み付け和により考慮することで, 2信号間の同期性をよりよく抽出する手法 (SBXCOR-MDW) を提案し, DTW単語認識により従来のSBXCORよりも耐雑音性が向上することを示す. さらに, 実環境下での性能を評価するため, マイクロホンアレイを用いて防音室にて収録した場合についても検討した. その結果, MDW処理を施したSBXCORは従来のSBXCORよりも最も悪いSN 比で+4%, 平滑化群遅延スペクトル (SGDS) やメルフィルタバンクケプストラム係数 (MFCC) と比べてもそれぞれ+8%, +13%の認識性能の向上が見られた.

収録刊行物

参考文献 (11)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1572824502299041408
  • NII論文ID
    110003279645
  • NII書誌ID
    AN10060786
  • ISSN
    09135685
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ