Wikipediaエントリとブログサイトの対応付けによる日本語ブログ空間のトピック分布推定(トピック)  [in Japanese] Estimating Topic Distribution of Japanese Blogosphere by Linking Wikipedia Entries to Blog Feeds  [in Japanese]

Abstract

本研究はWikipediaのエントリをプログサイトと対応付け,Wikipediaカテゴリ空間におけるプログサイトの分布の推定を行うことを目的とする.本稿では,各Wikipediaエントリについて,詳細な記述をしているブログサイトが存在するかどうかの推定を行った.検索ヒット数が一定数以上となるトピックに対しては,そのトピックについて詳細な記述をしているプログサイトが存在すると仮定し,Wikipediaの約30万エントリに対してブログ検索を行い,検索ヒット数を得た.その結果,検索ヒット数が1万〜50万の範囲であれば,そのエントリと関連性の深いブログサイトが一定数存在する事が分かった.また,Wikipediaカテゴリ空間におけるブログサイトの分布を調べるためには,Wikipediaカテゴリに対して適切な粒度を設定し,その粒度の単位でブログサイトの有無を観測する必要がある.そこで,ブログサイトが存在するWikipediaエントリの割合に基づいてWikipediaカテゴリの併合を行う手法を適用することにより,関連するブログサイトが存在し,かつ適切な粒度のWikipediaカテゴリを発見することができた.

This paper studies how to estimate distribution of topics in Japanese Blogosphere, where about 300,000 Wikipedia entries are used for representing a hierarchy of topics. First, in order to estimate whether there exists at least one blog feed closely related to a given topic, we use the number of hits of the topic keyword in the blogosphere. We empirically examine the range of the number of hits and conclude that the range should be 10,000〜500,000. According to our manual evaluation of this range, about 70% of Wikipedia entries can be linked to at least one blog feed, which partially justifies our claim. Next, we study how to discover Wikipedia categories with Wikipedia entries, where more than 30〜40% of them can be linked to blog feeds closely related to the corresponding topic. Through our manual evaluation of the discovered Wikipedia categories, we can conclude that the proposed technique is effective in discovering categories linking to many blog feeds that are closely related to certain topics in those categories.

Journal

IPSJ SIG Notes   [List of Volumes]

IPSJ SIG Notes 2008(90), 83-90, 2008-09-17  [Table of Contents]

Information Processing Society of Japan (IPSJ)

References:  6

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Cited by:  1

You must have a user ID to see the cited references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110006980334
  • NII NACSIS-CAT ID (NCID) :
    AN10115061
  • Text Lang :
    JPN
  • Article Type :
    Journal Article
  • ISSN :
    09196072
  • NDL Article ID :
    9668422
  • NDL Source Classification :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No. :
    Z14-1121
  • Databases :
    CJP  CJPref  NDL  NII-ELS 

Export