Wikipediaにおけるキーパーソン抽出による信頼度算出精度および速度の改善 An Improvement Method of Calculation Cost for Assessing the Quality of Wikipedia Articles

この論文にアクセスする

この論文をさがす

抄録

本研究では,Wikipedia において記事の信頼度を算出する際に,重要となる著者であるキーパーソンを簡易な方法で推定し,それら重要な著者の情報だけを利用して信頼度を算出することによって,すべての著者の情報を利用して信頼度を算出する方法よりも高速で精度の高い信頼度を算出する手法の提案を行う.これは,記事の大部分は少数の著者によって記述されているため,多くの著者の編集はその記事の信頼度には影響しないと考えることができ,それら多くの著者が行った編集を信頼度算出に用いないことにより,信頼度の算出にとって不要なノイズを除去することができると考えたためである.評価実験において信頼度が正しく算出できたかどうかを確かめた結果,確かに信頼度の精度が向上したことを確認することができた.さらに,提案手法を用いることにより,信頼度を計算するための計算コストを削減することも可能となった.We propose a fast credibility assessment system of Wikipedia articles by identifying major contributors to reduce the calculation costs in determining the degree of credibility of Wikipedia articles. In our proposed system, similar to existing credibility degree measuring systems, the first calculates each editor's credibility values using the lifetime of versions, which is a number of versions includes the edits. Next, our system calculates the credibility values of articles by combining those of the article's editors. In this process, when the system identifies a small number of major contributors who have large effects to credibility degrees of articles, we can reduce calculation costs. Therefore, we propose three methods for identifying major contributors, such as number of versions based method, number of distinct document based method, and combined method of number of versions based method and number of distinct document based method. In our experimental evaluation, we unveil that our proposed system can reduce the calculation costs and increase the accuracy of credibility values of articles.

収録刊行物

  • 情報処理学会論文誌データベース(TOD)

    情報処理学会論文誌データベース(TOD) 3(3), 20-32, 2010-09-28

    情報処理学会

各種コード

  • NII論文ID(NAID)
    110007990092
  • NII書誌ID(NCID)
    AA11464847
  • 本文言語コード
    JPN
  • 資料種別
    Article
  • ISSN
    1882-7799
  • NDL 記事登録ID
    024299081
  • NDL 請求記号
    YH247-812
  • データ提供元
    NDL  NII-ELS  IPSJ 
ページトップへ