検索エンジンを用いた研究者の所属情報抽出  [in Japanese] Mining Affiliation of Researchers using a Search Engine  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

本論文では,Web上の情報から研究者の所属に関する情報を抽出する.Semantic Webや情報検索では,人のネットワークを抽出/利用する研究が盛んに行われている.その際,個人の属性を得る技術は,これらの研究に重要である.本論文では,検索エンジンと機械学習を用い,研究者の氏名を与えると Webを検索して所属情報を返すシステムを提案する.まず,入力された研究者の氏名と所属機関の候補をANDでつなぎ,検索エンジンのクエリーとする.そのヒット件数を用いて氏名と所属の共起の強さを測り,所属の候補を絞る.その上で,再び検索エンジンを用いて,その研究者の略歴を探す.略歴と判定されたページがあれば,所属名とともに出力する.60名の研究者に対して評価を行い,その有効性と今後の課題を明らかにした.

This paper describes a new approach to extract affiliations of researchers from the Web. In the context of Semantic Web and information retrieval, there have been many studies on social network mining and utilization. In such systems, it is important to obtain personal metadata. In this paper, a novel algorithm using a search engine and machine learning is proposed to output the affiliation for a given researcher. First, given a researcher name, we query to a search engine with a combination of the name and candidate affiliations. Using the hit counts of a search engine, we measure the strength of co-occurrences, and provide the most possible affiliations. Then, web pages including the researcher's CV or profile are sought in order to confirm the affiliations. We evaluate our system on 60 researchers and show effectiveness of the algorithm as well as the scope and limitations.

Journal

  • Journal of Japan Society for Fuzzy Theory and Intelligent Informatics

    Journal of Japan Society for Fuzzy Theory and Intelligent Informatics 19(6), 670-679, 2007-12-15

    Japan Society for Fuzzy Theory and intelligent informatics

References:  39

Codes

  • NII Article ID (NAID)
    110006570138
  • NII NACSIS-CAT ID (NCID)
    AA1181479X
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    13477986
  • NDL Article ID
    9313704
  • NDL Source Classification
    ZM31(科学技術--数学) // ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z15-649
  • Data Source
    CJP  NDL  NII-ELS  J-STAGE 
Page Top