大規模な日本語話し言葉データベースを用いた講演音声認識

書誌事項

タイトル別名
  • ダイキボ ナ ニホンゴ ハナシコトバ データベース オ モチイタ コウエン オンセイ ニンシキ
  • Lecture Speech Recognition Using Large Corpus of Spontaneous Japanese

この論文をさがす

抄録

application/pdf

開放的融合研究「話し言葉工学」プロジェクトにおいて構築されている日本語話し言葉コーパスを用いて講演音声の認識を行った.話し言葉は書き言葉の読上げ音声と大きく性質が異なるため,それに合致したモデル化と認識手法の検討が必要となる.音響モデルについては発話スタイルとデータ量の影響を調べた.言語モデルについては,話し言葉コーパスのデータ量不足を補うために他のコーパスと混合する方法,特に混合重みの最適化手法を提案する.また認識に際して,事前の発話のセグメンテーションが容易でないため,ショートポーズの自動認識に基づいて区分化と認識結果の確定を行う逐次デコーディング方式を提案・実装した.10名の話者による講演音声の認識実験で提案手法の有効性を示し,平均66.2%の認識率を得た.

収録刊行物

被引用文献 (8)*注記

もっと見る

参考文献 (20)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ