実世界指向Web マイニングによる同姓同名人物の分離
Bibliographic Information
- Other Title
-
- ジツ セカイ シコウ Web マイニング ニ ヨル ドウセイ ドウ メイジンブツ ノ ブンリ
- Distinguishing between People on the Web with the Same First and Last Name by Real-world Oriented Web Mining
Search this article
Abstract
巨大なデータベースであるWeb から知識を抽出する一手法として実世界指向Web マイニングを提案する.従来のマイニングでは主に統計的な処理によりデータの特徴が抽出されていた.これに対し,実世界指向マイニングでは,実世界を意識したデータの解釈,具体的には,実世界のエンティティがデータの中にどのように現れ,相互にどういう関係を形成しているかを調べる.この考え方をWeb における人物の識別に適用し,同姓同名人物の分離を行った.これは,与えられた人名が出現するWeb ページを同一人物ごとにグループ分けするタスクで,本手法を用いた場合,平均9 割以上の高い率で正しく処理できることを確認した.
This paper proposes a technique called “real-world oriented Web mining” for extracting knowledge from the Web regarded as a huge database. While conventional mining techniques search for characteristics of data mostly by statistical analysis, the proposed technique interprets data from real-world oriented point of view. In more concrete terms, it locates real-world entities in the data and analyzes relationships among them. This idea has been applied for performing a task to distinguish between people on the Web with the same first and last name. The task is to classify Web pages with a given person’s name into groups each of which corresponds to a person in the real world. With the proposed technique, people have been identified with accuracy more than 90% on average.
Journal
-
- 情報処理学会論文誌データベース(TOD)
-
情報処理学会論文誌データベース(TOD) 46 (SIG8(TOD26)), 26-36, 2005-06-15
東京 : 情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050282812868587008
-
- NII Article ID
- 110002768776
- 10017662571
-
- NII Book ID
- AA11464847
-
- ISSN
- 18827799
- 03875806
-
- NDL BIB ID
- 7966205
-
- Text Lang
- ja
-
- Article Type
- article
-
- Data Source
-
- IRDB
- NDL
- CiNii Articles