計算機処理のための韓国語言語体系と形態素処理 Language System and Morphological Processing Technique for Korean Computational Processing

この論文にアクセスする

この論文をさがす

著者

抄録

韓国語の言語処理, 特に韓国語を原言語もしくは目的言語とする機械翻訳における, 韓国語の言語体系と形態素処理手法を提案する. 本論文の韓国語体系の特徴は, 機械処理を考慮した体系であるという点にある. すなわち, 形態素解析の解析精度や機械翻訳における品詞設定の必要性に応じて, 韓国語各品詞に対して仕様の検討を行ない, 設計を行なった. また分かち書きや音韻縮約といった韓国語の特徴をどのように機械処理すべきかについても述べる. 韓国語形態素解析では, 品詞と単語の混合n-gramによる統計的手法を基本としながら, 韓国語固有の問題に対しては残留文字などの概念を導入するなどして独自の対応を施した. 以上の品詞体系と形態素解析エンジンによって, 単語再現率99.1%, 単語適合率98.9%, 文正解率92T6%という良好な解析精度が得られた. また韓国語生成処理では, 特に分かち書き処理についてどのような規則を作成したのかについて提案を行なう. 以上の形態素体系と処理の有効性は, 機械翻訳システムTDMTの日韓翻訳, 韓日翻訳部に導入した際の翻訳精度という形で文献 (古瀬, 山本, 山田1999) において報告されている.

A morpheme and part-of-speech system for Korean natural language processing, or machine translation in particular, is proposed in this paper. We designed this language system for easier computer processing. It is important to attain satisfactory performance when we segment and tag input Korean strings. There is also underand over-classification in a linguistic part-of-speech system for machine translation. Thus we defined an original part-of-speech system, which is demonstrated in this paper with some examples. We based our morphological analysis on the mixed n-gram statistics of both parts-of-speech and words. We tuned up this engine to the Korean language for proper characteristics. Experiments have proven that our engine has 99.1% word recall, 98.9% word precision, and 92.6% sentence accuracy, for unseen Korean strings. In language generation, spacing rules are proposed for Korean using our part-of-speech system. We have proven the appropriateness of our morpheme system in the performance of machine translation for both Japanese-Korean and Korean-Japanese, as shown in (Furuse, Yamamoto, and Yamada, 1999).

収録刊行物

  • 自然言語処理 = Journal of natural language processing

    自然言語処理 = Journal of natural language processing 7(4), 25-62, 2000-10-10

    一般社団法人 言語処理学会

参考文献:  16件中 1-16件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    10008829871
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5544177
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ