HMMに基づく音声認識のための音節モデルとtriphoneモデルの比較  [in Japanese] Comparison of Syllable-Based HMMs and Triphone-Based HMMs in Terms of Speech Recog* Performan  [in Japanese]

Search this Article

Author(s)

Abstract

現在, 音声認識の手法として隠れマルコフモデルが広く用いられているが, 基本的な構造のHMMには特徴パラメータ時系列の時間的な変化特性を十分に表現できないという欠点がある.以前, 我々は, 複数のフレームを結合してセグメントを構成し, それを音節HMMに入力する, セグメント単位入力HMMの有効性を示すとともに, セグメント単位入力の統計量に△ケプストラム, △△ケプストラムを使用すると更に性能が向上することを示した.本論文ではパワー情報の追加, 混合分布, コンテクスト依存モデルを採用した場合の結果について述べる.次に世界的標準となっているtriphoneモデルと音節モデルを認識性能の観点から比較し, 実験結果より音節もtriphoneと同様に日本語の音声認識において有効な単位であるということを示す.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00006), 1412-1421, 2000-06-25

    The Institute of Electronics, Information and Communication Engineers

References:  31

Cited by:  40

Codes

  • NII Article ID (NAID)
    110003223927
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5385489
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top