文章のセグメント間関係解析に基づく文章構造解析  [in Japanese] Text Structure Analysis based on Inter-segment Relation Analysis  [in Japanese]

    • 春日 隆緒 Kasuga Takao
    • (株)日立製作所インターネットプラットホーム事業部 Internet Platform Division Hitachi Ltd.
    • 田村 直良 Tamura Naoyoshi
    • 横浜国立大学大学院環境情報研究院 Graduate School of Environment and Information Sciences Yokohama National University

Abstract

修辞構造理論では、20あまりの修辞関係を定義し、この修辞関係によって文章を関係づけ、それらを階層的に表現しているが、修辞構造木の根の付近では、大きな単位(セグメント)で修辞構造を同定することは困難であり、また用意された修辞関係が適切であるとは限らない。本稿では、小さな意味段落内を修辞構造で扱いつつ意味段落間の関係付けをすることにより、2段階的な文章構造解析を示す。実現した文章解析器は、新聞社説記事を対象に、漸進的な処理により修辞構造解析を行い、トピック関連語彙を元に意味段落間の関係付け、論説文の定型的な構造をふまえた上で、ある話題から筆者の主張を導き出すまでの論旨の展開の過程を考慮にいれた解析を行う。

In this paper, we present text structure analysis, which produces semantic segments according to the rhetorical structure theory at the first stage and analyze inter-relationship of the segments at the second stage. In the rhetorical structure theory, relations between sentences and segments are classified with pre-defined 20 rhetorical relations, and upper level segments are produced hierarchically with sentences and lower segments recursively. However, structuring such as the identification of relation is getting more difficult as coming near to the top level of the structure. We show two-stage representation. In the implementation, stack-based incremental analysis are done for rhetorical structure analysis and then relations between produced semantic segments are analyzed according to the topic words chain and the schema-based assertion flow analysis.

Journal

IPSJ SIG Notes   [List of Volumes]

IPSJ SIG Notes 2003(57), 59-64, 2003-05-26  [Table of Contents]

Information Processing Society of Japan (IPSJ)

References:  7

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110002911640
  • NII NACSIS-CAT ID (NCID) :
    AN10115061
  • Text Lang :
    JPN
  • Article Type :
    ART
  • ISSN :
    09196072
  • NDL Article ID :
    6615718
  • NDL Source Classification :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No. :
    Z14-1121
  • Databases :
    CJP  NDL  NII-ELS 

Share