ブログユーザ空間からの重複を許した頻出コミュニティ抽出法

Bibliographic Information

Other Title
  • ブログ ユーザ クウカン カラノ チョウフク オ ユルシタ ヒンシュツ コミュニティ チュウシュツホウ
  • Extraction Method of Overlapping Frequent Communities from Blog User Spaces

Search this article

Abstract

本研究では,ブログの書き手であるブロガに焦点を当て,ブロガをノード,トラックバックによるつながりを辺としたグラフから,数カ月にわたって頻出し,かつ重複を許したコミュニティを発見する手法を提案する.提案手法は,複数のグラフから頻出部分グラフを抽出し,得られた頻出部分グラフに重複を許したクラスタリング手法を適用することにより,重複を許した頻出コミュニティを発見する.頻出部分グラフの抽出については,頻出部分グラフ抽出の問題を頻出アイテム集合抽出の問題に変換し,LCM 法を用いることで頻出部分グラフ抽出を達成している.重複を許したクラスタリングについては,頻出部分グラフをNewman らのクラスタリング手法を応用し,縮約グラフの作成と再クラスタリングすることで達成している.提案手法の有用性を確認するために,複数カ月にわたりブログデータを収集し,頻出コミュニティの抽出を行った.その結果,共通の興味・関心を持って頻出するコミュニティと,複数のコミュニティに重複してクラスタリングされるブロガを発見できた.

In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step,we applied the Newman’s algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities.As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.

Journal

References(21)*help

See more

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top