実世界指向Web マイニングによる同姓同名人物の分離

Bibliographic Information

Other Title
  • ジツ セカイ シコウ Web マイニング ニ ヨル ドウセイ ドウ メイジンブツ ノ ブンリ
  • Distinguishing between People on the Web with the Same First and Last Name by Real-world Oriented Web Mining

Search this article

Abstract

巨大なデータベースであるWeb から知識を抽出する一手法として実世界指向Web マイニングを提案する.従来のマイニングでは主に統計的な処理によりデータの特徴が抽出されていた.これに対し,実世界指向マイニングでは,実世界を意識したデータの解釈,具体的には,実世界のエンティティがデータの中にどのように現れ,相互にどういう関係を形成しているかを調べる.この考え方をWeb における人物の識別に適用し,同姓同名人物の分離を行った.これは,与えられた人名が出現するWeb ページを同一人物ごとにグループ分けするタスクで,本手法を用いた場合,平均9 割以上の高い率で正しく処理できることを確認した.

This paper proposes a technique called “real-world oriented Web mining” for extracting knowledge from the Web regarded as a huge database. While conventional mining techniques search for characteristics of data mostly by statistical analysis, the proposed technique interprets data from real-world oriented point of view. In more concrete terms, it locates real-world entities in the data and analyzes relationships among them. This idea has been applied for performing a task to distinguish between people on the Web with the same first and last name. The task is to classify Web pages with a given person’s name into groups each of which corresponds to a person in the real world. With the proposed technique, people have been identified with accuracy more than 90% on average.

Journal

Citations (5)*help

See more

References(13)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top