日本語話し言葉音声認識のための音節に基づく高精度な音響モデルの検討 Syllable-Based Acoustical Modeling for Japanese Spontaneous Speech Recognition

この論文をさがす

著者

抄録

日本語話し言葉音声認識のための音節に基づく音響モデリング手法について検討している.従来,「モーラ」単位に基づくサブワード音響モデルが検討され,読み上げ音声認識においてその効果が確認されている.それに対し本報告では,「音節」と「モーラ」をその定義から明確に区別し,話し言葉音声認識において,「音節」が「モーラ」より音響モデルの単位として適していることを示す.具体的には,話し言葉音声特有の現象で,頻繁に発生する「長母音化」に注目し,これを明確に考慮した音節モデル,並びにその高精度なモデリング手法を提案する.学会講演音声を対象とした認識実験の結果,提案モデルによって従来のtriphoneモデル,モーラモデルを上回る認識性能を得ることができた.

We study on a syllable-based acoustical modeling method for Japanese spontaneous speech recognition. Traditionally, mora-based acoustic models have been adopted for Japanese read speech recognition system. In this paper, syllable-based unit and mora-based unit are clealy distinguished in their definition, and syllables are shown to more suitable as an acoustic model in Japanese spontaneous speech recognition. In spontaneous speech, a vowel lengthening occurs frequently, and recognition accuracy is greatly affected by this phenomena. In this view point, we propose an acoustical modeling technique that emplicitly incorporates the vowel lengthening in syllable-based HMMs. Experimental results showed that the proposed model could exceed the performance of conventionally used cross-word triphone model and mora-based model in Japanese spontaneous speech recognition task.

収録刊行物

  • 電子情報通信学会技術研究報告. SP, 音声

    電子情報通信学会技術研究報告. SP, 音声 102(529), 49-54, 2002-12-12

    一般社団法人電子情報通信学会

参考文献:  17件中 1-17件 を表示

被引用文献:  3件中 1-3件 を表示

各種コード

  • NII論文ID(NAID)
    110003295578
  • NII書誌ID(NCID)
    AN10013221
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    6434985
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS 
ページトップへ