Read/Search this Article
Abstract
我々は現在,Web情報の信憑性評価を行うために,あるトピックに関するWeb文書集合において,さまざまな視点や角度から述べられる言明を抽出し,それらの間の類似・対立・根拠等の関係を認識して,ユーザに言明と関係の情報を提示する言論マップ生成課題に取り組んでいる.本論文では言論マップ生成のために,Web上に存在する客観的表現や,意見などの主観的表現を扱うためには,どのような種類の意味的関係が必要であるかについて議論する.また,言明間意味的関係コーパスを構築するために我々が必要とする意味的関係を持つような用例対をWeb文書から効率よく収集する方法についても議論する.そして,言明間意味的関係コーパスを構築するためのアノテーション結果について報告し,これまでにアノテーションが終了している約1,500言明ペアについての評価に対する考察を行う.この言明間意味的関係コーパスは,今夏に試用版を公開する予定である.
Recognizing semantic relation is indispensable for summarizing multi-documents. In this paper, we discuss what types of semantic relations are needed to identify a variety of viewpoints on a given topic on the Web and to present these relations to users together with supporting evidence in a way that makes it clear how they are related. In order to construct a Japanese corpus, containing this information, we define semantic relations dealing with facts and opinions, and discuss how to efficiently collect valid examples and their associated semantic relations from Web documents by splitting complex sentences into fundamental units of meaning called "statements" and annotating relations at the statement level. We present an annotation scheme and examine its reliability by annotating around 1,500 pairs of statements. We are preparing the corpus for public release this summer.
Journal
- IEICE technical report. Natural language understanding and models of communication [List of Volumes]
-
IEICE technical report. Natural language understanding and models of communication 109(142), 31-36, 2009-07-15 [Table of Contents]
The Institute of Electronics, Information and Communication Engineers