話題語を手がかりとしたブログからのイベントマイニングの検討  [in Japanese] Event mining from Blogsphere using topic words  [in Japanese]

Search this Article

Author(s)

    • 数原 良彦 SUHARA Yoshihiko
    • 慶應義塾大学大学院 理工学研究科 開放環境科学専攻 Graduate School of Science and Technology, Keio University
    • 戸田 浩之 TODA Hiroyuki
    • 日本電信電話株式会社NTTサイバーソリューション研究所 NTT Cyber Solutions Laboratories, NTT Corporation
    • 櫻井 彰人 SAKURAI Akito
    • 慶應義塾大学大学院 理工学研究科 開放環境科学専攻 Graduate School of Science and Technology, Keio University

Abstract

本研究では,関連する2つの話題語を手がかりとして,動作主,動作対象,動作を記述する動作関係を抽出する手法を提案する.ここでいう話題語とは,最新のブログ記事中で特徴的に出現する固有名詞のことで,従来手法によりブログ記事から自動的に抽出する.我々は,関連する話題語間の関係を記述することで,より的確に話題の内容について記述できると考える.提案手法では,2つの話題語をキーワードとして行ったAND検索により取得したブログ記事から,キーワードに付属する格助詞とそれに伴う述語を用いて関係を記述する.しかし,実際にはしばしば省略が行われるため,2つのキーワードが共起する文を見つけることが難しい.そこで,与えられた2つのキーワードについて,ひとつのキーワードが現れる文の述語と,もうひとつのキーワードが現れる文の述語が同一の場合,これは一つの動作関係を表しているとして,動作関係の抽出を実現する.

In this paper, we propose a method to extract "action relations" between related topic words from Japanse weblog (blog). The action relation is a tuple of an agent, a target and a predicate. Our method obtains blog articles that contain two keywords by AND search and outputs action relations constructed from the predicate and the two keywords with following case particles. A noun which is followed by a case particle is called a case element. However, since words are often omitted after once they appear, the sentences with the targeted keywords are scarce. Our method solves this problem by combining two sets of sentences, each of which contains a keyword and a predicate common with the other.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 176, 67-73, 2006-11-22

    Information Processing Society of Japan (IPSJ)

References:  13

Codes

  • NII Article ID (NAID)
    110005717797
  • NII NACSIS-CAT ID (NCID)
    AN10115061
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    0919-6072
  • NDL Article ID
    8572455
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  NDL  NII-ELS 
Page Top