Geocrawler : 個人サイトの評価情報と位置情報に基づいた店舗検索用Webインデクサの開発
書誌事項
- タイトル別名
-
- Geocrawler コジン サイト ノ ヒョウカ ジョウホウ ト イチ ジョウホウ ニ モトズイタ テンポ ケンサクヨウ Web インデクサ ノ カイハツ
- Geocrawler : Web Indexer for Store Search based on Geographical Information and Evaluation Information on Personal Web Sites
この論文をさがす
抄録
近年,口コミ情報サイトを例とする,ユーザの行動を基にした店舗・施設の検索サイトが注目されている.これらの検索サイトでは,位置に基づいた検索が可能であることと,店舗・施設に対して複数のユーザからの第3 者の評価情報が取得できることが求められている.しかし,商用の検索サイトには広告収入や検閲の影響により,被評価店舗にとって不都合な情報が現れにくく第3 者の評価情報の提供に問題がある.また,従来の情報取得手法ではWWW 上の情報をすべて収集し,複雑な自然言語処理によって位置に基づいた評価情報を抽出する作業が必要となり,サービス構築コストが膨大となるという問題がある.そこで本研究では従来の全文型検索エンジンを活用し,目的の分野を示すキーワードと商用検索サイトを除外するキーワードを組み合わせることによって目的の第3 者の評価情報を収集する手法と,単純な形態素解析と文字列のパターンマッチングを用いた文字列処理によって住所を抽出する手法を提案する.この手法に基づいてWeb インデクサを評価した結果,一度の収集のうち44%が目的とする個人サイトであり,位置情報の取得再現率が59%という結果が得られた.
収録刊行物
-
- 情報処理学会論文誌
-
情報処理学会論文誌 48 (7), 2319-2327, 2007-07-15
情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050014359400036608
-
- NII論文ID
- 110006345318
- 120005716626
-
- NII書誌ID
- AN00116647
-
- ISSN
- 03875806
- 18827764
-
- HANDLE
- 10061/4971
-
- NDL書誌ID
- 8890685
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles