読みやすい字幕生成のための講演テキストへの改行挿入

書誌事項

タイトル別名
  • ヨミ ヤスイ ジマク セイセイ ノ タメ ノ コウエン テキスト エ ノ カイギョウ ソウニュウ
  • Linefeed Insertion into Lecture Transcription for Automatic Captioning

この論文をさがす

抄録

リアルタイム字幕生成とは,講演や解説などの音声をテキストで提示するものであり,聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術である.講演では一文が長くなる傾向にあり,多くの文がスクリーン上で複数行にまたがって表示されることになるため,テキストが読みやすくなる位置に改行が挿入されている必要がある.本論文では,読みやすい字幕を生成するための要素技術として,日本語講演文への改行挿入手法を提案する.本手法では,係り受け,節境界やポーズ,行長などの情報に基づき,統計的手法によって改行位置を決定する.日本語講演データの1,714文を使用した実験では,改行挿入の再現率で82.66%,適合率で80.24%を達成し,本手法の有効性を確認した.

収録刊行物

被引用文献 (3)*注記

もっと見る

参考文献 (22)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ