フローグラフからの手順書の生成

Bibliographic Information

Other Title
  • Procedual Text Generation from a Flow Graph

Search this article

Abstract

コンピュータから人間へ情報を伝達するためには,コンピュータが処理しやすい表現を,人間に理解しやすい自然言語文に変換する技術が重要である.本研究では,構造化された情報であるフローグラフから自然言語文を自動生成する手法を提案する.手順書のドメインとしてレシピを扱う.まず,実際の手順書に対して重要語とその種類を表すラベルを自動認識し,固有表現に置き換えることで,統計的なテンプレートの自動生成を行う.次に,フローグラフを1つの動作を含む最小手順部分グラフに分割する.最後に,最小手順部分グラフに最もマッチするテンプレートを選択して文生成を行う.テンプレート選択の指標として,負対数確率,内容語残存コスト,エントロピーを用いる.実験では,正解として用意されたフローグラフを表現する自然言語文章と生成された文章を比較評価した.具体的にはBLEU値による自動評価と主観評価を行い,提案手法が精度向上に寄与し,BLEUが人手による主観評価と相関があることを確認した.

Algorithms that convert a computational representation to human-readable natural language sentences are essential for communications. In this paper, we propose a method that automatically generates natural language sentences from a structured flow graph. We demonstrate this method in the domain of cooking recipes. Firstly, we automatically generate templates from real recipe texts by recognizing keywords and their type label, and replacing the words with named entity labels. Secondly, we divide the flow graph into minimum procedural subgraphs, each of which has one action. Finally, we select the most suitable template for each subgraph. When selecting a template, we use three measures: a negative logarithmic probability, a remaining content word cost, and a sentence entropy. In the experiments we generate recipe texts from flow graphs and evaluated them through both an objective metric BLEU and a subjective evaluation by human examines. The results showed that our method improves both metrics and BLEU is correlated to the subjective metrics.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top