複数文書から抽出した言明間の意味的関係の整理と関係付与(コーパス) Annotating Statement Pairs Extracted from Web Documents with Semantic Relations

    • 増田 祥子 MASUDA Shouko
    • 奈良先端科学技術大学院大学情報科学研究科:大阪府立大学人間社会学研究科 Nara Institute of Science and Technology:Osaka Prefecture University
    • NICHOLS Eric
    • 奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology

Abstract

我々は現在,Web情報の信憑性評価を行うために,あるトピックに関するWeb文書集合において,さまざまな視点や角度から述べられる言明を抽出し,それらの間の類似・対立・根拠等の関係を認識して,ユーザに言明と関係の情報を提示する言論マップ生成課題に取り組んでいる.本論文では言論マップ生成のために,Web上に存在する客観的表現や,意見などの主観的表現を扱うためには,どのような種類の意味的関係が必要であるかについて議論する.また,言明間意味的関係コーパスを構築するために我々が必要とする意味的関係を持つような用例対をWeb文書から効率よく収集する方法についても議論する.そして,言明間意味的関係コーパスを構築するためのアノテーション結果について報告し,これまでにアノテーションが終了している約1,500言明ペアについての評価に対する考察を行う.この言明間意味的関係コーパスは,今夏に試用版を公開する予定である.

Recognizing semantic relation is indispensable for summarizing multi-documents. In this paper, we discuss what types of semantic relations are needed to identify a variety of viewpoints on a given topic on the Web and to present these relations to users together with supporting evidence in a way that makes it clear how they are related. In order to construct a Japanese corpus, containing this information, we define semantic relations dealing with facts and opinions, and discuss how to efficiently collect valid examples and their associated semantic relations from Web documents by splitting complex sentences into fundamental units of meaning called "statements" and annotating relations at the statement level. We present an annotation scheme and examine its reliability by annotating around 1,500 pairs of statements. We are preparing the corpus for public release this summer.

Journal

IEICE technical report. Natural language understanding and models of communication   [List of Volumes]

IEICE technical report. Natural language understanding and models of communication 109(142), 31-36, 2009-07-15  [Table of Contents]

The Institute of Electronics, Information and Communication Engineers

References:  15

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110007360368
  • NII NACSIS-CAT ID (NCID) :
    AN10091225
  • Text Lang :
    ENG
  • Article Type :
    ART
  • ISSN :
    09135685
  • NDL Article ID :
    10308076
  • NDL Source Classification :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No. :
    Z16-940
  • Databases :
    CJP  NDL  NII-ELS 

Export