頑健な英日機械翻訳システム実現のための原文自動前編集  [in Japanese] Automatic Preediting of English Sentences for a Robust English-to-Japanese MT System  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

本稿では, 従来の機械翻訳システムの構文解析能力を越える倒置や挿入などを含む文に対して頑健な処理を実現するための一手法として, 形態素解析と簡単な構文解析によって得られる情報に基づいて原文を書き換える自動前編集手法を示す. 原文書き換え系を既存システムに追加することによって, 1) より品質の高い翻訳がシステムの既存部分にほとんど変更を加えることなく得られるようになるだけでなく, 2) 構文解析の負担が減少するためシステム全体としての効率化が実現できる. 実際, 提案手法を我々の英日機械翻訳システムPower E/Jに組み込み, 新聞記事を対象として実験を行なったところ, 1) 書き換え規則が適用された330文の78.8%にあたる260文の翻訳品質が改善され, 2) 書き換えを行なった場合の翻訳速度は行なわない場合の速度の1.12倍になった.

As a means of allowing for robust processing of such linguistic phenomena as inversion, ellipsis, parenthesis and emphasis, which are liable to prevent a syntactic parser from generating appropriate syntactic structures, this paper shows a method of automatically preediting sentences, based on information obtained by morpholexical and simple syntactic analysis. Addition of a preediting module to the existing system makes it possible 1) to generate better translations, which would not otherwise be generated, with little or no changes to the existing parts of the system, and 2) to reduce the load of syntactic analysis, thus enhancing the efficiency of the whole system. We have incorporated the proposed method into our English-to-Japanese machine translation system Power E/J, and carried out an experiment with sentences in news wire articles. The incorporation of the preediting module has satisfactorily 1) improved the quality of translations for the 260 sentences out of rewritten 330 ones (78.8%), and 2) marked up the speed of 1.12 times as fast as the system without the module.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 7(4), 99-117, 2000-10-10

    The Association for Natural Language Processing

References:  23

Cited by:  6

Codes

  • NII Article ID (NAID)
    10008829934
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5544226
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top