書誌事項
- タイトル別名
-
- End-of-Word Survey of Compound Words Representing Disease Names
抄録
Seinan Jo Gakuin University
Seinan Jo Gakuin University
Osaka University
Osaka University
National Institute for Japanese Language and Linguistics
会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター
本研究では合成語の語末により病名の判別が可能か否かを確認するために合成語の語末調査を行った。具体的には、病名を表す合成語5,465 語について語末のunigram、bigram、trigram を調べた。加えて、筆者等が着手している電子カルテに記載された合成語を対象とした語構成要素解析で定めた語単位で、合成語を分割した場合に語末となる語構成要素の頻度を調べた。その結果、(1)右側主要部の規則による意味を用いた判別が可能なこと、(2)病名の末尾には「ヘモクロマトーシス」のようなカタカナ語があり、文字単位での判別より語単位の判別の方が適していることが分かった。また、意味ラベル「接尾語」が付与された語構成要素と、「病名」が付与された語構成要素の内「接尾語」を含まない要素を用いることで「病名」の機械的な判別が可能であることが示唆された。
source:https://pj.ninjal.ac.jp/corpus_center/lrw2020.html
identifier:西南女学院大学
identifier:西南女学院大学
identifier:大阪大学
identifier:大阪大学
identifier:国立国語研究所
収録刊行物
-
- 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
-
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop 5 151-156, 2020
国立国語研究所
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390853649698697088
-
- NII論文ID
- 120006978811
-
- Web Site
- http://id.nii.ac.jp/1328/00003154/
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- IRDB
- CiNii Articles
- KAKEN