Hidden Conditional Neural Fieldsを用いた音声認識における目的関数と階層的音素事後確率特徴量の検討 Investigations of Objective Functions and Hierarchical Phoneme Posterior Feature for Hidden Conditional Neural Fields based Automatic Speech Recognition

この論文にアクセスする

この論文をさがす

抄録

我々は,Hidden Conditional Neural Fields(HCNF) を用いた音声認識手法について検討を進めている.本稿では,HCNFを学習するための目的関数として,正解状態系列が一意に定まらない場合においても正解状態系列に対するエラー数を考慮した学習が可能となるHidden Boosted MMI(HB-MMI) を提案する.HB-MMIを用いることで,過学習が起こりにくい状況では認識率を改善できることがわかった.本稿では,HCNFが出力する音素事後確率を次段のHCNFの特徴量とする階層的音素事後確率特徴量を用いた音声認識手法についても述べる.階層的音素事後確率特徴量を単独で用いる場合でも認識率の改善を得ることができたが,HB-MMI学習を組み合わせることで,さらなる改善を得ることができた.We have investigated automatic speech recognition using Hidden Conditional Neural Fields(HCNF). In this paper, we propose a new objective function, Hidden Boosted MMI(HB-MMI), which can consider the number of errors in training data even if the correct state sequence is not known for training HCNF. The experimental results show that HB-MMI can improve recognition accuracy when overfitting does not occur. In this paper, we also present an automatic speech recognition method using hierarchical phoneme posterior feature where the output of the first HCNF is used for the input of the second HCNF. The experimental results show that the feature can improve the recognition accuracy. By using both of the proposed methods, we obtained further improvement.

収録刊行物

  • 研究報告 音声言語情報処理(SLP)

    研究報告 音声言語情報処理(SLP) 2011-SLP-85(13), 1-6, 2011-01-28

    情報処理学会

各種コード

  • NII論文ID(NAID)
    110007891200
  • NII書誌ID(NCID)
    AN10442647
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    2186-2583
  • NDL 記事登録ID
    025116162
  • NDL 請求記号
    YH267-101
  • データ提供元
    NDL  NII-ELS  IPSJ 
ページトップへ