ブログユーザ空間からの重複を許した頻出コミュニティ抽出法 Extraction Method of Overlapping Frequent Communities from Blog User Spaces

この論文にアクセスする

この論文をさがす

著者

    • 高木 允 TAKAKI MAKOTO
    • 広島市立大学大学院情報科学研究科 Graduate School of Information Sciences, Hiroshima City University
    • 森 康真 MORI YASUMA
    • 広島市立大学大学院情報科学研究科 Graduate School of Information Sciences, Hiroshima City University
    • 北上 始 KITAKAMI HAJIME
    • 広島市立大学大学院情報科学研究科 Graduate School of Information Sciences, Hiroshima City University

抄録

本研究では,ブログの書き手であるブロガに焦点を当て,ブロガをノード,トラックバックによるつながりを辺としたグラフから,数カ月にわたって頻出し,かつ重複を許したコミュニティを発見する手法を提案する.提案手法は,複数のグラフから頻出部分グラフを抽出し,得られた頻出部分グラフに重複を許したクラスタリング手法を適用することにより,重複を許した頻出コミュニティを発見する.頻出部分グラフの抽出については,頻出部分グラフ抽出の問題を頻出アイテム集合抽出の問題に変換し,LCM 法を用いることで頻出部分グラフ抽出を達成している.重複を許したクラスタリングについては,頻出部分グラフをNewman らのクラスタリング手法を応用し,縮約グラフの作成と再クラスタリングすることで達成している.提案手法の有用性を確認するために,複数カ月にわたりブログデータを収集し,頻出コミュニティの抽出を行った.その結果,共通の興味・関心を持って頻出するコミュニティと,複数のコミュニティに重複してクラスタリングされるブロガを発見できた.In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step,we applied the Newman's algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities.As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.

In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step, we applied the Newman's algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities. As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.

収録刊行物

  • 情報処理学会論文誌数理モデル化と応用(TOM)

    情報処理学会論文誌数理モデル化と応用(TOM) 49(SIG4(TOM20)), 93-104, 2008-03-15

    社団法人情報処理学会

参考文献:  21件中 1-21件 を表示

各種コード

  • NII論文ID(NAID)
    110006684621
  • NII書誌ID(NCID)
    AA11464803
  • 本文言語コード
    JPN
  • 資料種別
    Article
  • ISSN
    1882-7780
  • NDL 記事登録ID
    9421114
  • NDL 請求記号
    Z74-C192
  • データ提供元
    CJP書誌  NDL  NII-ELS  IR  IPSJ 
ページトップへ