音声認識のための高速最ゆう推定を用いた声道長正規化

書誌事項

タイトル別名
  • Vocal Tract Length Normalization using Rapid Maximum-Likelihood Estimation for Speech Recognition

この論文をさがす

抄録

近年、隠れマルコフモデル(HMM)を用いた大語業音声認識システムにおいて、声道長パラメータを用いた話者正規化の手法が提案されている。本稿では、声道長による特徴量の変化を、ケプストラム空間における声道長パラメータを用いた線形写像で表現し、そのパラメータを発声から最ゆう推定する手法を提案する。従来の、複数の声道長パラメータを予め用意する手法に比べ、計算量が少なく、より話者に最適なパラメータが推定可能、などの利点がある。日本語5000単語認識を用いた評価実験において、本方式単独で、7.1%誤りが減少し、また、ケプストラム平均正規化(CMN)と組み合わせた場合に、14.6%誤りが減少した。

収録刊行物

参考文献 (9)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571135652440059520
  • NII論文ID
    110003278517
  • NII書誌ID
    AN10091225
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ