Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone (第6回音声言語シンポジウム) Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone

この論文をさがす

著者

抄録

走行中の車内のような騒々しい環境においても,精度の高い音声認識技術が望まれている.本稿では,二段雑音スペクトルの推定という手法を提案され,一つの遠隔マイクロホンで収録した音声データを基に,非線形回帰を行うことで,車内での音声認識精度の向上を目指した.12車内走行条件の音声認識実験によっで,もとの遠隔マイクロホンに比べて相対ワード認識誤りを65%の程度で減少できる結果が得られた.

In this paper, we present a two-stage noise spectra estimation approach. After the first-stage noise estimation using the improved minima controlled recursive averaging (IMCRA) method, the second-stage noise estimation is performed by employing a maximum a posteriori (MAP) noise amplitude estimator. We also develop a regression-based speech enhance system by approximating the clean speech with the estimated noise and original noisy speech. Evaluation experiments show that the proposed two-stage noise estimation method results in lower estimation error for all test noise types. Compared to original noisy speech, the proposed regression-based approach obtains an average relative word error rate (WER) reduction of 65% in our isolated word recognition experiments conducted in 12 real car environments.

収録刊行物

  • 電子情報通信学会技術研究報告

    電子情報通信学会技術研究報告 104(542), 127-132, 2004-12-21

    一般社団法人電子情報通信学会

各種コード

  • NII論文ID(NAID)
    110003298469
  • NII書誌ID(NCID)
    AN10013221
  • 本文言語コード
    ENG
  • 資料種別
    特集 // 会議録・学会報告
  • ISSN
    09135685
  • NDL 記事登録ID
    7222471
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    NDL  NII-ELS 
ページトップへ