古典中国語形態素解析による地名の自動抽出

Bibliographic Information

Other Title
  • Extraction of Place Names from Classical Chinese Texts Using Morphological Analysis

Abstract

MeCabを用いた古典中国語の形態素解析に際し,地名に特化した自動抽出法を提案する.具体的には,形態素解析に用いる古典中国語辞書に,地名を大量に追加する手法を提案する.ただし,そのような手法においては,「1 文字の地名」と同一の漢字が別の意味をも持ちうる場合,それら対抗用例に誤検出が生じる可能性がある.この問題に対し,我々は,地名用例を含む古典中国語形態素コーパスと,その対抗用例コーパスの両方を準備することで,誤検出を低く抑えることに成功した.合わせて,古典中国語辞書に含まれる地名の数と,F 値との関係を調べ,本稿の手法の定量的評価を試みた.

In this paper we propose a method to extract place names from classical Chinese texts. In the method, we use our original morphological analyzer based on MeCab with our digital dictionary, in which we especially added many place names. A place name with one character can be easily mistaken for another morpheme. We include many example sentences with place names in our digital corpus, and also include many counter-examples in the corpus, in order to reduce incorrect detection. Additionally, we evaluate the method quantitatively using F-measure, changing the number of place names in the dictionary.

Journal

Related Projects

See more

Details 詳細情報について

  • CRID
    1050574047130579456
  • NII Article ID
    170000088037
  • Web Site
    http://id.nii.ac.jp/1001/00107363/
  • Text Lang
    ja
  • Article Type
    conference paper
  • Data Source
    • IRDB
    • CiNii Articles
    • KAKEN

Report a problem

Back to top