Read/Search this Article
Abstract
情報検索用テストコレクションを構築する動きが国際的に活発化し,新聞記事,論文抄録,Web文書などを対象にした大規模なコレクションが構築され,研究利用のために公開されている.特許検索システムは長い歴史を持つアプリケーションであるにもかかわらず,特許文書は従来の研究対象として扱われることが少なかった.本稿は,国立情報学研究所が主催するNTCIR-4ワークショップにおいて遂行中の特許検索タスクと構築中のテストコレクションについて説明する.NTCIR-4ワークショップは大学や企業などからシステム参加を募り,情報検索や自然言語処理に関する技術の評価を行っている.特許検索タスクでは,特許庁審査官やサーチャーが行う無効資料調査を代行する検索システムの評価を行らている.特許請求項を入力して,そこで請求されている権利を無効化できる別の特許を検索することが目的である.さらに,特許マップを自動作成するシステムの評価も行っている.ある技術に関して検索された特許を開発課題や達成手段など複数の軸で分類し可視化することが目的である.最終的に構築されるテストコレクションは,特許検索だけでなく,一般の情報検索に関する様々な研究課題を探求するために有効である.
Large test collections targeting newspaper articles, technical abstracts, and Web documents have been produced by various international activities and are available for information retrieval research purposes. While a number of commercial patent retrieval systems and services have operated for a long time, patent documents have not received much attention in the research communities. In this paper we describe the Patent Retrieval Task, which is a part of the NTCIR4 Workshop organized by the National Institute of Informatics, and the test collections produced in this task. The NTCIR-4 Workshop provides a forum in which researchers of universities and private companies share the same evaluation framework for information retrieval and natural language processing. We perform the invalidity search task, in which each participant group searches a patent collection for the patents that can invalidate the demand in an existing claim. We also perform automatic patent map generation, in which the patents associated with a specific topic are organized in a multi-dimensional matrix. The resultant test collections can be useful not only for patent retrieval purposes, but also for exploring various retrieval problems.
Journal
- IPSJ SIG Notes [List of Volumes]
-
IPSJ SIG Notes 2004(1), 45-52, 2004-01-13 [Table of Contents]
Information Processing Society of Japan (IPSJ)
Share