Web リンク構造解析と自然言語処理による組織関係の抽出についての研究

書誌事項

タイトル別名
  • Web リンク コウゾウ カイセキ ト シゼン ゲンゴ ショリ ニ ヨル ソシキ カンケイ ノ チュウシュツ ニ ツイテ ノ ケンキュウ
  • Research for Extracting of Organization Relationship Diagram by Web Link Structure Analysis and Natural Language Processing
  • データマイニング・データウエアハウス

この論文をさがす

抄録

近年のインターネットの複雑化にともない,Web の自動解析による情報取得に対する需要が高まっている.そのため,Web ページをカテゴリに分類する手法やWeb の関係情報を解析する手法が数多く提案されてきた.しかし,既存の研究では,Web の自動解析は,リンク関係を中心とした解析を行っており,リンク関係のないWeb ページを関連付けることが困難であった.このため,本論文では,リンク構造解析だけでなく,形態素解析によって任意の単語から関係情報の抽出を行うことで,リンク関係のないWeb ページを関連付ける.また,その結果と品質判定を行ったリンク構造解析結果を組み合わせることで,信頼性の高いWeb ページの関係図を作成する.さらに,アルゴリズムの評価として,Web から取得した情報を利用して,組織の関係図を作成する.そして,既存研究においての主要な方式であるリンク構造解析による結果との比較を行った.評価方式には,リンク構造解析で一般的に用いられている評価値とグラフ理論による可視化を採用し,その結果から本方式の有用性を確認した.

The demand for the information acquisition by the automatic analysis of the Web has been increased as the Internet recently becomes complicated. Then, a method of classifying the Web into some categories and analyzing the Web relationships with the information were suggested. In early researches, however, it was difficult to relate the Web pages without the links because the analysis was mainly done on the link relationships. Therefore, on this research, we related the Web pages without the link relationships not only by analyzing the link structure but also by extracting any kinds of topics using morphological analysis. And, we drew a high reliable relationship diagram combining our processing consequence with the quality judged result of the link analysis. In addition, we drew the organization charts using the acquired information from the Web in order to evaluate our algorithm. Then, we compared the link structure analysis which was the main method of the early researches with our result. We chose the evaluate value which is generally utilized for the link structure analysis and the visualization by graph theory as the evaluation method. We confirmed that our method was available.

収録刊行物

被引用文献 (3)*注記

もっと見る

参考文献 (16)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ