計算機処理のための韓国語言語体系と形態素処理  [in Japanese] Language System and Morphological Processing Technique for Korean Computational Processing  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

韓国語の言語処理, 特に韓国語を原言語もしくは目的言語とする機械翻訳における, 韓国語の言語体系と形態素処理手法を提案する. 本論文の韓国語体系の特徴は, 機械処理を考慮した体系であるという点にある. すなわち, 形態素解析の解析精度や機械翻訳における品詞設定の必要性に応じて, 韓国語各品詞に対して仕様の検討を行ない, 設計を行なった. また分かち書きや音韻縮約といった韓国語の特徴をどのように機械処理すべきかについても述べる. 韓国語形態素解析では, 品詞と単語の混合n-gramによる統計的手法を基本としながら, 韓国語固有の問題に対しては残留文字などの概念を導入するなどして独自の対応を施した. 以上の品詞体系と形態素解析エンジンによって, 単語再現率99.1%, 単語適合率98.9%, 文正解率92T6%という良好な解析精度が得られた. また韓国語生成処理では, 特に分かち書き処理についてどのような規則を作成したのかについて提案を行なう. 以上の形態素体系と処理の有効性は, 機械翻訳システムTDMTの日韓翻訳, 韓日翻訳部に導入した際の翻訳精度という形で文献 (古瀬, 山本, 山田1999) において報告されている.

A morpheme and part-of-speech system for Korean natural language processing, or machine translation in particular, is proposed in this paper. We designed this language system for easier computer processing. It is important to attain satisfactory performance when we segment and tag input Korean strings. There is also underand over-classification in a linguistic part-of-speech system for machine translation. Thus we defined an original part-of-speech system, which is demonstrated in this paper with some examples. We based our morphological analysis on the mixed n-gram statistics of both parts-of-speech and words. We tuned up this engine to the Korean language for proper characteristics. Experiments have proven that our engine has 99.1% word recall, 98.9% word precision, and 92.6% sentence accuracy, for unseen Korean strings. In language generation, spacing rules are proposed for Korean using our part-of-speech system. We have proven the appropriateness of our morpheme system in the performance of machine translation for both Japanese-Korean and Korean-Japanese, as shown in (Furuse, Yamamoto, and Yamada, 1999).

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 7(4), 25-62, 2000-10-10

    The Association for Natural Language Processing

References:  16

Cited by:  1

Codes

  • NII Article ID (NAID)
    10008829871
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5544177
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top