断片的な環境測定に基づく雑音除去の検討 (音声)  [in Japanese] Noise reduction based on fragmentary measurement of environmental noise  [in Japanese]

Search this Article

Author(s)

Abstract

実環境における遠隔発話音声認識において,環境雑音の存在は音声認識の性能を著しく劣化させる.これまで,環境雑音に対して複数マイクロホンを用いた手法が提案されてきたが,マイクロホンの同期・常時観測を前提としており,大きなコストを要した.そこで,本稿ではそのような前提を必要としない非同期・間欠観測に基づく雑音下音声認識を提案する.本手法では,部屋の中の様々な場所に設置されたマイクロホンが間欠的に音の観測を行い,観測した音をGMMによりモデル化する.入力音声に対しては,あらかじめモデル化しておいた各雑音クラスに対し,雑音除去と音声認識を並列に行う.そして,各認識結果を統合することで最終的な認識結果を出力する.実験では,モデル化された各雑音クラスを個別に適用した場合でそれぞれの認識率を比較したところ,適用する雑音クラスによって認識率に差がみられた.また,付加された雑音が変わると最適な雑音クラスも変わることを明らかにした.さらに,認識結果を統合することにより,通常のスペクトル減算法と比べて2〜5 %の認識率の向上が得られた.

We propose a speech recognition method under noisy environments using multiple microphones based on asynchronous and intermittent observations. In this method, microphones placed at various locations in the room sometimes observe sounds, and clustering by GMM is performed to model the noise in the environment. Each of the clustered noise spectrum is subtracted from the input signal, and then the noise-reduced signals are decoded in parallel. Then, the final recognition result is determined by integrating all of the recognition results.

Journal

  • IEICE technical report. Speech

    IEICE technical report. Speech 113(161), 1-6, 2013-07-25

    The Institute of Electronics, Information and Communication Engineers

Codes

  • NII Article ID (NAID)
    110009778097
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • ISSN
    0913-5685
  • NDL Article ID
    024743769
  • NDL Call No.
    Z16-940
  • Data Source
    NDL  NII-ELS 
Page Top