古典中国語形態素解析による地名の自動抽出

書誌事項

タイトル別名
  • Extraction of Place Names from Classical Chinese Texts Using Morphological Analysis

抄録

MeCabを用いた古典中国語の形態素解析に際し,地名に特化した自動抽出法を提案する.具体的には,形態素解析に用いる古典中国語辞書に,地名を大量に追加する手法を提案する.ただし,そのような手法においては,「1 文字の地名」と同一の漢字が別の意味をも持ちうる場合,それら対抗用例に誤検出が生じる可能性がある.この問題に対し,我々は,地名用例を含む古典中国語形態素コーパスと,その対抗用例コーパスの両方を準備することで,誤検出を低く抑えることに成功した.合わせて,古典中国語辞書に含まれる地名の数と,F 値との関係を調べ,本稿の手法の定量的評価を試みた.

In this paper we propose a method to extract place names from classical Chinese texts. In the method, we use our original morphological analyzer based on MeCab with our digital dictionary, in which we especially added many place names. A place name with one character can be easily mistaken for another morpheme. We include many example sentences with place names in our digital corpus, and also include many counter-examples in the corpus, in order to reduce incorrect detection. Additionally, we evaluate the method quantitatively using F-measure, changing the number of place names in the dictionary.

収録刊行物

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050574047130579456
  • NII論文ID
    170000088037
  • Web Site
    http://id.nii.ac.jp/1001/00107363/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ