実践医療用語の語構成要素抽出の試み

書誌事項

タイトル別名
  • Extracting of Word Constituents Contained in Medical Terms

抄録

Shonan Institute of Technology

National Institute for Japanese Language and Linguistics

Mejiro University

Seinan Jo Gakuin University

National Institute for Japanese Language and Linguistics

Seinan Jo Gakuin University

会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター

医療現場で用いられる電子カルテなどの記録文書(医療記録)に専門用語としての医療用語が大量に含まれている。医療記録に記載された言語情報を正確に理解・活用するためにはこれらの医療用語の理解が必要となる。医療記録に含まれる語には、複数の語からなる複合語や臨時一語も多く、これらは、病名、身体の部位名、処置名、薬剤名等、様々な用語から構成されている。しかし、現在はこの語構成要素の組み合わせのパターンや語構成要素間の関係などが曖昧である。そこで、本研究では複数の語からなる実践医療用語の語構成要素の抽出を試みた。語構成要素の条件を独自で定義した後、ComJisyoV5、と今後公開予定のV6の登録候補語に対象として、MecabMeCab0.996とUniDic-cwj-2.2.0を利用して形態素解析を行った。分割された単語の品詞情報を手がかりにして、単一単位となり得る品詞列を抽出した。次に抽出した候補リスト以外に語構成要素となる品詞列があるかについて検討を行った。

source:https://pj.ninjal.ac.jp/corpus_center/lrw2018.html

identifier:湘南工科大学

identifier:国立国語研究所

identifier:目白大学

identifier:西南女学院大学

identifier:国立国語研究所

identifier:西南女学院大学

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ