抄録
Web情報の最も大きな特徴は、ハイパーリンクにより、複数のページが関係付けられ、その関係がアンカーテキストという形で記述されている点にある。本研究では、大規模なWeb文書コレクションであるるNTCIRのnw100gテストコレクションから抽出したアンカーテキストを対象に、アンカーテキストの機能分類を提案すると共に、機能分類の自動化のための方針、機能分類の特徴を生かしたWeb情報活用システムの応用手法について述べる。
Most significant characteristics of the Web information is description about a relationship among different pages by using hyperlinks and anchor texts. In this research, anchor texts extracts from large web test collection NTCIR nw100g are investigated for a proposal of a functional classification. A strategy for automatic classification of anchor texts in html pages and systems that utilize this classification are also proposed in this paper.