MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム  [in Japanese] Unsupervised Acoustic Model Adaptation Algorithm Using MLLR in Noisy Environment  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

MLLRと多数話者データベースを用いたHMM音響モデルの教師なし環境雑音適応アルゴリズムを提案する.対象話者の任意の1文発声と居室雑音を入力として音声データベースから環境適応用雑音重畳データを生成することで,話者に負担をかけずに大量の適応用データを得ることができる.具体的な適応処理は以下の3段階からなる.(1)GMMを用いた話者識別を用いて,入力話者と音響的距離の近い話者をデータベースから選択する.(2)(1)の選択話者の読み上げ音声をデータベースから抽出し,居室雑音を重畳する.(3)その雑音重畳音声を適応サンプルとしてMLLRによる適応を行う.更に,十分統計量と話者距離による教師なし話者適応及びHMM合成法を統合することで,高精度な教師なし統合適応システムを構築する.大語彙連続音声認識において評価した結果,提案手法による適応モデルは環境Matched Modelと同等以上の認識精度を示し,数十サンプルを用いた教師ありMLLRに近い性能が得られた.本適応システムによって認識率はSNRが20dBの雑音環境下においてmonophoneモデルで48.3%から70.5%に,PTMモデルで60.1%から79.9%に改善された.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 85(5), 833-841, 2002-05-01

    The Institute of Electronics, Information and Communication Engineers

References:  10

Cited by:  3

Codes

  • NII Article ID (NAID)
    110003184310
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    6152208
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IR 
Page Top