レファレンスデータに対するNDCの自動付与 Automatically Classifying the Reference Records into NDC

この論文にアクセスする

この論文をさがす

著者

    • 江藤 正己 ETO Masaki
    • 慶應義塾大学大学院文学研究科図書館・情報学専攻 Graduate School of Library and Information Science, Keio University

抄録

本研究では,国立国会図書館(NDL)のレファレンス協同データベースに収録されたレファレンス記録に対するNDC の自動付与実験を行った。手法としては決定木法、ナイーブベイズ法,SVM(Support Vector Machine)法の3つの機械学習法を用いた。5703件のレファレンス記録中の質問文および回答文それぞれに含まれる単語を対象に学習させ,634件を対象に分類したところ,質問文を対象に手法としてはSVM法を用いた場合にわずかに正しく付与される傾向が見られた。ただし,再現率,精度ともに対象や手法による差はそれほど大きくなかった。また,分野カテゴリごとの再現率を調べたところ,分野によって再現率に大きな差があった。分野によっては60%を超える再現率で分類できる場合もあり,機械学習法でレファレンス記録にNDC を付与することが有効であることが明らかになった。

In this research, we conducted the experiment of automatically classifying the reference records in the Collaborative Reference Database of the National Diet Library into Nippon Decimal Classification (NDC). Three machine learning methods: decision tree, Naïve Bayes, and Support Vector Machine (SVM) methods - were tested on the words included in the sentences of questions and answers in 634 reference records. The results indicate that the using the SMV method and answer sentences were classified successfully compared to others. As for the recall and precision ratio, there was small difference among the methods, and between question and answer sentences. The significant difference, however, was observed in the recall ratio by the NDC category; the result of some category obtained more than 60% recall ratio, which suggested that classifying reference records into NDC by using machine learning methods was effective.

収録刊行物

  • 情報知識学会誌

    情報知識学会誌 17(2), 61-64, 2007-05-25

    情報知識学会

参考文献:  6件中 1-6件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    110006291426
  • NII書誌ID(NCID)
    AN10459774
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09171436
  • NDL 記事登録ID
    8862103
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1782
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS  J-STAGE 
ページトップへ