読みやすい字幕生成のための講演文への漸進的改行挿入

Bibliographic Information

Other Title
  • ヨミ ヤスイ ジマク セイセイ ノ タメ ノ コウエンブン エ ノ ゼンシンテキ カイギョウ ソウニュウ
  • Incremental Linefeed Insertion into Lecture Transcription for Automatic Captioning

Search this article

Abstract

リアルタイム字幕生成とは,講演や解説などの音声をテキストで提示するものであり,聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術である.講演では一文が長くなる傾向にあり,多くの文がスクリーン上で複数行にまたがって表示されることになるため,テキストが読みやすくなる位置に改行が挿入されている必要がある.本論文では,読みやすい字幕を生成するための要素技術として,日本語講演文への漸進的な改行挿入手法を提案する.本手法では,係り受け,節境界やポーズ,行長などの情報に基づき,統計的手法によって漸進的に改行位置を決定する.日本語講演データを使用した実験によって本手法の有効性を確認した.The development of a captioning system that supports the real-time understanding of spoken documents such as lectures and commentaries is required. In monologues, since a sentence tends to be long, each sentence is often displayedin multi lines on the screen, it is necessary to insert linefeeds into a text so that the text becomes easy to read. This paper proposes a technique for incrementally inserting linefeeds into a Japanese spoken monologue as an elementaltechnique to generate the readable captions. Our method appropriately and incrementally inserts linefeeds into a sentence by machine learning, based on the information such as dependencies, clause boundaries, pauses and line length. An experiment using Japanese speech data has shown the effectiveness of our technique.

Journal

References(20)*help

See more

Details 詳細情報について

Report a problem

Back to top