音素情報と音調情報を統合した中国語連続音声認識

書誌事項

タイトル別名
  • Recognition of Chinese Continuous Speech Based on the Integration of Phonetic and Prosodic Information

この論文をさがす

抄録

本稿では、音素情報と音調情報を統合した中国語連続音声認識システムについて報告する。まず基本となる(音調情報を用いない)連続音声認識システム及び音調認識システムの概要を説明する。前者では60個の音素クラスのHMMを用い、後者では7個の音調単位のHMMを用いている。音素情報と音調情報の結合は、単語単位で同期をとって行なっている。扱うタスクはホテル予約で、文脈自由文法(CFG)で中国語の構文を記述している。テストセットパープレキシティは27.3である。10名の話者の各々が発声した107文について、音素情報と音調情報の重みを変化させて実験した結果、最良の結果として平均文認識率69.3%を得た。音調情報を用いない場合より約6%改善された。また、この結果は有意水準0.2%で有意であることがわかった。

収録刊行物

被引用文献 (8)*注記

もっと見る

参考文献 (11)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573668927129962624
  • NII論文ID
    110003296284
  • NII書誌ID
    AN10013221
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ