総合目録データに対する機械的書誌同定と著作同定の試み : ゆにかねっとレコードによる実験 Automatic Identification of Duplicate Records and "Works" in Japanese Union Catalogs : An Experiment on UNICANET Bibliographic Records

この論文をさがす

著者

    • 谷口 祥一 TANIGUCHI Shoichi
    • 筑波大学大学院図書館情報メディア研究科 Graduate School of Library, Information and Media Studies, University of Tsukuba

抄録

総合目録ネットワーク「ゆにかねっと」のレコード群を対象に,機械的な書誌同定と著作同定を試みた。どの程度機械的同定が可能であるのか,どのような選択肢が有効であるのかを検証した。DC-NDL形式の書誌レコードから指定したフィールドの値を抽出し,正規化処理を加えて同定キーを生成し,同定用に保持したデータベースと照合する方式とした。タイトルや著者の採用する範囲,同定キーの組み合わせ方,その他の選択肢について,それぞれ機械的同定処理を実行し,人手により形成した正解集合との照合に基づき評価を行った。その結果,機械的な書誌同定と著作同定はともに十分に機能することが示された。併せて,1)採用した正規化処理の有効性,2)シリーズタイトル以外のタイトルとそのよみの包括的な採用,タイトルの分解・組み立ての採用の有効性が,また3)著者とそのよみの包括的な採用,出版者による著者の代用の有効性がそれぞれ示された。

Automatic identification of duplicate records and "works" was tried on bibliographic records in UNICANET, a union catalog operated by the National Diet Library. Identifying duplicates is to group records representing the same resource while identifying "works" indicates to group records sharing the same work, being defined in FRBR. This paper reports the extent to which records can be automatically identified as members of a particular resource and of a particular work and also which of the possible alternatives are effective. The method used in this study is to extract data values from certain fields in records encoded in DC-NDL schema, to normalize those values, and then to generate identification keys to be matched with a database storing incrementally the identified records. Several ways of choosing fields and values for title and author name, combing the generated identification keys, and other choices were examined and grouping records was executed for each way. The record groups built automatically were evaluated by comparing them with the sample correct sets built manually. The results of the experiment show that automatic identification of duplicates and works is fully archived. It also shows that it is effective (a) to use the normalization proposed, (b) regarding the choices in titles, to adopt titles and their transcription comprehensively except series titles, and to apply the decomposition and recombination of titles while generating the title identification keys, and (c) as for authors, to adopt author names and their transcription comprehensively, and to take publishers when no author is found.

収録刊行物

  • 日本図書館情報学会誌  

    日本図書館情報学会誌 57(4), 124-140, 2011-12-31 

    日本図書館情報学会

各種コード

  • NII論文ID(NAID)
    110009425339
  • NII書誌ID(NCID)
    AA11333306
  • 本文言語コード
    JPN
  • ISSN
    13448668
  • NDL 記事登録ID
    023515925
  • NDL 請求記号
    Z21-133
  • データ提供元
    NDL 
ページトップへ