読みやすい字幕生成のための講演文への漸進的改行挿入 Incremental Linefeed Insertion into Lecture Transcription for Automatic Captioning

この論文にアクセスする

この論文をさがす

著者

抄録

リアルタイム字幕生成とは,講演や解説などの音声をテキストで提示するものであり,聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術である.講演では一文が長くなる傾向にあり,多くの文がスクリーン上で複数行にまたがって表示されることになるため,テキストが読みやすくなる位置に改行が挿入されている必要がある.本論文では,読みやすい字幕を生成するための要素技術として,日本語講演文への漸進的な改行挿入手法を提案する.本手法では,係り受け,節境界やポーズ,行長などの情報に基づき,統計的手法によって漸進的に改行位置を決定する.日本語講演データを使用した実験によって本手法の有効性を確認した.The development of a captioning system that supports the real-time understanding of spoken documents such as lectures and commentaries is required. In monologues, since a sentence tends to be long, each sentence is often displayed in multi lines on the screen, it is necessary to insert linefeeds into a text so that the text becomes easy to read. This paper proposes a technique for incrementally inserting linefeeds into a Japanese spoken monologue as an elemental technique to generate the readable captions. Our method appropriately and incrementally inserts linefeeds into a sentence by machine learning, based on the information such as dependencies, clause boundaries, pauses and line length. An experiment using Japanese speech data has shown the effectiveness of our technique.

収録刊行物

  • 研究報告自然言語処理(NL)

    研究報告自然言語処理(NL) 2009-NL-191(7), 1-8, 2009-05-14

    情報処理学会

参考文献:  13件中 1-13件 を表示

各種コード

  • NII論文ID(NAID)
    110008003205
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    024778931
  • NDL 請求記号
    YH247-911
  • データ提供元
    CJP書誌  NDL  NII-ELS  IR  IPSJ 
ページトップへ