Hidden Conditional Neural Fieldsを用いた音声認識の検討 A Study of Automatic Speech Recognition using Hidden Conditionan Neural Fields

この論文にアクセスする

この論文をさがす

抄録

近年,識別モデルを用いた音声認識手法が注目を集めている.特に,Hidden Conditional Randam Fields(HCRF) を用いた音声認識手法は,HMM の自然な拡張となっており,今後の発展が期待できる.HCRF は有望なモデルであるが,仮説のスコアを特徴量の重み付き線形和によって計算するため,特徴量間の非線形な関係をうまくモデル化できないという問題があった.本稿では,HCRF にゲート関数を導入することで,特徴量間の非線形な関係をモデル化することができるように拡張した Hidden Conditional Neural Fields (HCNF) を用いた音声認識手法を提案する.HCNF は,一切の初期モデルを必要とせずに学習することが可能であり,種々の特徴量を使用することも容易である.TIMIT コーパスにおける core テストセット上での monophone を用いた音素認識実験の結果,HCNF による認識結果は,HCRF および,MPE 学習した HMM による認識結果よりもよく,提案法の有効性を示すことができた.Recently, there has been increasing attention in automatic speech recognition using discriminative models. Especially, Hidden Conditional Random Fields(HCRF) is a natural extension of traditional HMM and therefore very promising. However, because HCRF computes the score of a hypothesis by summing up linearly weighted feature values, it cannot consider non-linearity between feature values that will be very crucial for speech recognition. In this paper, we extend HCRF by incorporating gate function used in neural networks and propose a new model called Hidden Conditional Neural Fields(HCNF). Differently with conventional approaches, HCNF can be trained without any initial model and incorporate any kinds of features. Experimental results of continuous phoneme recognition on TIMIT core test set using monophone showed that HCNF was superior to HCRF and HMM trained in MPE manner.

収録刊行物

  • 研究報告音声言語情報処理(SLP)

    研究報告音声言語情報処理(SLP) 2010-SLP-83(1), 1-6, 2010-10-22

各種コード

  • NII論文ID(NAID)
    110007990736
  • NII書誌ID(NCID)
    AN10442647
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • データ提供元
    NII-ELS  IPSJ 
ページトップへ