実践医療用語の語構成要素への分割と意味ラベル付与の試み

DOI 機関リポジトリ オープンアクセス

書誌事項

タイトル別名
  • A Trial for Segmentation and Annotation of Semantic Label for the Practical Medical Terms

抄録

National Institute for Japanese Language and Linguistics

Seinan Jo Gakuin University

Seinan Jo Gakuin University

Mejiro University

Osaka University

会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター

本発表では、電子医療記録に含まれる実践医療用語の語構成を明らかにするために、独自に設計した語構成要素への分割とそれに対する意味ラベルの付与を行い、意味ラベルによる語構成のパターンを調査した。調査対象は、ComeJisyoSjis-1(111,664語)から、『分類語彙表 増補改訂版』に収録されている語を含む約7,000語から抽出した1,000語である。これらを短単位よりやや長めの語構成要素に分割し、意味ラベルを付与した。意味ラベルは、石井(2007)の複合名詞の語構造把握のための意味分類を参考にしたが、実践医療用語のために独自に設けたものも多い。分析結果から、以下のような点が明らかになった。(1)語構成要素数が2個と3個のものが全体の8割以上を占める。(2)意味ラベルは、「疾患」「身体部位」「状態」「症状」「医療行為」「時間」「生理」の7つで全体の約8割を占める。(3)意味ラベルは、語頭により多く出現するもの(「身体部位」「時間」)や語末により多く出現するもの(「医療行為」「症状」「障害」)などがあり、分布に偏りが見られる。

source:https://pj.ninjal.ac.jp/corpus_center/lrw2019.html

identifier:国立国語研究所

identifier:西南女学院大学

identifier:西南女学院大学

identifier:目白大学

identifier:大阪大学

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ