レコードリンケージにおける統計モデルによる個人同定処理の自動化について A Statistical Method for Automatic Identification in Record Linkage

この論文にアクセスする

この論文をさがす

著者

抄録

レコードリンケージにおける個人同定処理は,計算機が未発達であった時期から必要とされていたこともあり,国内では経験的な手法についての議論が先行している.本稿では,レコード値の一致型ペア数に対して,2項分布の和を想定し,ポアソン近似することで統計モデルに基づいた手法を議論する.また,経験的な知識の統計モデルへの利用方法についても検討し,計算機による同定処理の自動化を行う際に有用なレコード値の頻度を考慮した判定基準を提案した.解析例によって,統計モデルの適合度を検証することができ,新規でレコードリンケージを行う場合のみならず,既存の照合結果の検証にも有効であることが示唆された.

As computing environments improve, many data files can be created and stored easily. Some of them might be related to each other and include records on the same person. For example, hospitals have clinical records and the government has vital statistics. We often need to link these records together in medical, epidemiological or sociological research. In Japan, however, no identifica-tion number is available like the Social Security Number in the USA. Therefore, we have to link records by using common key fields (or variables) among those files, such as family name, given name, address, sex, birthdate, etc. The procedure is known as record linkage and many empirical approaches have been considered. We discuss a mathematical model based on a pair of binomial distributions and propose a statistical method for automatic identification using frequencies of fixed record values.

収録刊行物

  • 応用統計学

    応用統計学 34(1), 1-13, 2005

    Japanese Society of Applied Statistics

各種コード

  • NII論文ID(NAID)
    130001294586
  • NII書誌ID(NCID)
    AN00330942
  • 本文言語コード
    JPN
  • ISSN
    0285-0370
  • NDL 記事登録ID
    7470220
  • NDL 雑誌分類
    ZM31(科学技術--数学)
  • NDL 請求記号
    Z15-401
  • データ提供元
    NDL  J-STAGE 
ページトップへ