情報検索尺度Okapi-BM25と交換可能語ペアを用いた自動ICDコーディングに関する研究

書誌事項

タイトル別名
  • Automatic ICD Coding by using Information Retrieval Method Okapi-25 and Exchangeable Word Pairs

この論文をさがす

抄録

ICDコーディングは,保健・福祉行政の企画,人口問題,さらには,それらの国際比較という重要な目的を持つ.しかし,同時に時間 / コストがかかる作業であり,可能な部分においては自動コーディングする技術が待ち望まれている.本研究は,標準病名マスターの病名とそれに付与されたICDコードを材料に,標準病名マスターに収載されない病名に対して自動コーディングを目指す.<br/> 提案手法は,まず,入力病名と類似した病名を標準病名マスターから検索する.次に,検索結果の上位の標準病名がもつICDコードの投票を行うことにより,入力病名のコードを決定する.<br/> 類似度を検索する際には,情報検索モデルOkapi-BM251)を用いた.ただし,BM25(をはじめとする多くの検索モデル)は,個々の語が独立に分類に影響すると考えており,複数の語が組み合わさって生み出される影響を捉えることはできない.しかし,実際の病名においては,このような現象が多く存在する.例えば,「頭部熱傷」と「顔面熱傷」はともに同一コード(T200)を持ち,「熱傷」を含む病名においては,「頭部」と「顔面」は無視可能な差異となっている.本研究では,このようなある語と共起した場合に交換可能な語ペアの知識を自動抽出し,その知識を用いて検索を行う.<br/> 実験の結果,44.0%の精度で適切なICDコードを付与可能であった.また,特に5語以上の長い病名に対しては,より高い精度(精度50.8%)で分類可能であった.本研究により,情報検索アプローチによるICDコーディングの可能性示すことができたと考える.

収録刊行物

  • 医療情報学

    医療情報学 27 (1), 101-107, 2007

    一般社団法人 日本医療情報学会

参考文献 (23)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ