ニュース音声認識における言語モデルの検討

書誌事項

タイトル別名
  • Performance evaluation of language models for broadcast news speech recognition

この論文をさがす

抄録

ニュース音声は読み上げ音声に比べ音声認識が困難な題材であるが、高齢者・聴覚障害者のための字幕付与サービスなどへの応用が期待されている。今年になって、NHKニュース放送音声のデータベースが構築され、これを対象とした音声認識タスクが研究されている。大語彙音声認識には精度の良い言語モデルが不可欠であるが、本研究では、(1)付属語連鎖・複合名詞を連語として登録し一単語として扱う連語モデル、(2)名詞語彙をタスクに合わせて入れ換える名詞フラットモデル、(3)品詞に基づいて語彙を分類した品詞クラスモデル、という3種類のN-gram言語モデルを作成した。その結果、(1)についてはパープレキシティの改善が見られた。これらの言語モデルをニュース音声認識に適用した結果について報告する。

収録刊行物

参考文献 (13)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570854177362520832
  • NII論文ID
    110003296045
  • NII書誌ID
    AN10013221
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ