技術論文の国際特許分類体系への自動分類システムにおける機能要素の高度化と最適化

書誌事項

タイトル別名
  • ギジュツ ロンブン ノ コクサイ トッキョ ブンルイ タイケイ エ ノ ジドウ ブンルイ システム ニ オケル キノウ ヨウソ ノ コウドカ ト サイテキ カ
  • Improvement and Optimization of Automatic Research Paper Classification into an International Patent Classification System

この論文をさがす

抄録

企業が技術戦略を策定する際,技術動向を調査・視覚化してその方針決定に役立てる.このような調査に有益なツールの1つとして特許マップがあり,多くの場合,この作成には特許文書に付与されている国際特許分類(IPC)コードが利用される.この特許マップに学術論文の情報を追加することができれば,より有益なツールになると考えられるが,現在学術論文はIPCに基づいた分類が成されておらず特定分野の網羅的な調査には大きな負担がともなう.本稿では,学術論文に自動的にIPC分類コードを付与するシステムの精度向上を目指し,分類手法を構成する3つの要素について高度化とパラメータの最適化を図った.本稿が最適化した3つの要素とは,文書からのキーワード抽出,クエリ拡張,類似特許検索における適合度計算である.これらの要素について,いくつかの方法とパラメータを変化させて実験的に評価し,その最適値を見出した.結果,再現率をほとんど低下させることなく,MAP値を0.199から0.494に改善することができた.

A patent map is a technical information map which was made by analyzed patents. It would become more useful if it includes information not only on patents but also research papers. To achieve this, automatic classification of research papers into the International Patent Classification System (IPC) is required, and some systems has been developed. In the present paper, the elemental functions which is consisted in an automatic technical paper classification system are improved and optimized for obtaining higher classification accuracy. The new method that focuses on keyword extraction is proposed and search query is expanded by concept base. In addition, patent document has a specific structure consisting sections represented in different granularity keywords. A method that weighing the score of similarity calculated between each structural element is proposed. Using the methods described above, the optimum value of precision is got by varying parameters. As a result, the MAP value was up to 0.494 from 0.199 in empirical assessment.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ