特定分野の学術論文をピンポイントで抽出し,いかに検索するか? Defect dat@baseの実践例  [in Japanese] A pinpoint search system for a specialized research area in physics and engineering : "Defect dat@base" for defects in semiconductors and semiconductor devices  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 梅田 享英 UMEDA Takahide
    • 筑波大学大学院図書館情報メディア研究科・知的コミュニティ基盤研究センター Research Center for Knowledge Communities, Graduate School of Library, Information and Media Studies, University of Tsukuba
    • 萩原 茂 HAGIWARA Shigeru
    • 筑波大学知的コミュニティ基盤研究センター・非常勤職員 Research Center for Knowledge Communities, University of Tsukuba
    • 水落 憲和 [他] MIZUOCHI Norikazu
    • 筑波大学大学院図書館情報メディア研究科・知的コミュニティ基盤研究センター Research Center for Knowledge Communities, Graduate School of Library, Information and Media Studies, University of Tsukuba
    • 磯谷 順一 ISOYA Junichi
    • 筑波大学大学院図書館情報メディア研究科・知的コミュニティ基盤研究センター Research Center for Knowledge Communities, Graduate School of Library, Information and Media Studies, University of Tsukuba

Abstract

インターネットの世界だけでなく,科学技術の世界でも情報量(学術論文)の急激な増加が問題となっている。そのような論文大量生産時代には,大量の論文の中から特定の論文をピンポイントで抽出したり,検索したりする技術が重要になってくる。本稿では,ソーシャルブックマーク技術を応用して,物理学・工学領域の中の「半導体の結晶欠陥」に関する重要な学術論文をピンポイントで検索するデータベースシステムDefect dat@baseについて紹介する。また,このデータベースに該当する重要な論文を専門家と同じ精度で学術雑誌から自動的に抽出するために,人間(専門家)とコンピュータの抽出アルゴリズムとの間で,約16,000件の学術論文に対する大規模かつ詳細な抽出比較実験を行い,さらに一般文書との違いについても比較検討した。その研究結果について詳しく述べる。<br>

Similar to the Internet, scientific and technological communications are rapidly accelerating in the 21st century. Among many papers in scientific journals, researchers must find out proper ones by using search engines of journal databases as well as other techniques that enables "pinpoint" search. We developed such a pinpoint search system based on the social bookmark technology, entitled "Defect dat@base" (http://www.kc.tsukuba.ac.jp/div-media/defect/). This database covers the specialized research area of "Defects in Semiconductors and Semiconductor Devices", and is collecting and precisely classifying important papers in this area in cooperation with specialist members. To extend and maintain the collection by not only human specialists but also computers, we studied statistical and morphological algorithms. As a result, we could learn how to choose important papers as accurate as human specialists do. Using over 16,000 papers of physics and engineering and over 77,000 e-mail texts, we carried out a large-scale comparative studies about differences between human and computer, and reached the following conclusion: Scientific papers are not as easily selectable as we can do for other types of texts, and for the better selection, we should focus on technical terms of the relevant area as well as abstracts and title words of the relevant papers.<br>

Journal

  • Journal of Information Processing and Management

    Journal of Information Processing and Management 51(9), 653-666, 2008

    Japan Science and Technology Agency

Cited by:  1

Codes

  • NII Article ID (NAID)
    130000072631
  • NII NACSIS-CAT ID (NCID)
    AN00116534
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    0021-7298
  • NDL Article ID
    9720195
  • NDL Source Classification
    ZM1(科学技術--科学技術一般) // ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL Call No.
    Z14-375
  • Data Source
    CJPref  NDL  J-STAGE 
Page Top