Denoising Autoencoderを用いた残響下大語彙音声認識の検討  [in Japanese]

Access this Article

Search this Article

Abstract

Denoising Autoencoder を用いて残響が重畳した対数パワースペクトルからその影響を除去した対数パワースペクトルを生成する手法を提案する.音声の時間変化をモデル化するため,提案法では連続した複数の短時間分析窓によるスペクトルフレームを連結したものをネットワークの入力として用いる.さらに,音声認識に必要なサブ音素レベルでの時間分解能を維持しながら時定数の大きな残響の影響をより正しく捕らえることを目的として,長さの異なる 2 つの分析窓長を併用する拡張手法を提案する.実験では,CENSREC-4 を用いた数字音声認識により提案法が従来手法よりも効果的であることを示す.さらに,JNAS を用いた音声認識を行い,提案法が大語彙連続音声認識においても耐残響フロントエンドとして有効であることを示す.

Journal

  • 研究報告音声言語情報処理(SLP)

    研究報告音声言語情報処理(SLP) 2013-SLP-97(1), 1-6, 2013-07-18

Codes

  • NII Article ID (NAID)
    170000077690
  • NII NACSIS-CAT ID (NCID)
    AN10442647
  • Text Lang
    JPN
  • Article Type
    Technical Report
  • Data Source
    IPSJ 
Page Top