音声認識のための高速最ゆう推定を用いた声道長正規化  [in Japanese] Vocal Tract Length Normalization Using Rapid Maximum-Likelihood Estimation for Speech Recognition  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

近年, 隠れマルコフモデル(HMM)を用いた大語彙音声認識システムにおいて, 声道長正規化と呼ばれる話者による声道長の違いを補正する話者正規化の手法が提案されている.本論文では, 声道長による特徴量の変化を, ケプストラム空間における声道長パラメータを用いた線形写像で近似し, そのパラメータを発声から最ゆう推定する手法を提案する.従来の複数の声道長パラメータをあらかじめ用意する手法に比べ, 計算量が少なく, より話者に最適なパラメータが推定可能である.日本語5000単語認識を用いた評価実験において, 本方式単独で, 7.1%誤りが減少し, また, ケプストラム平均正規化(CMN)と組み合わせた場合に, 14.6%誤りが減少した.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00011), 2108-2117, 2000-11-25

    The Institute of Electronics, Information and Communication Engineers

References:  17

Cited by:  30

Codes

  • NII Article ID (NAID)
    110003183820
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5641777
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IR 
Page Top