英字新聞記事見出し翻訳の自動前編集による改良 Improvement of Translation Quality of English Newspaper Headlines by Automatic Preediting

この論文にアクセスする

この論文をさがす

著者

抄録

英字新聞記事の見出しは通常の文の表現形式とは異なる特有の形式をしているため, 従来の英日機械翻訳システムによる見出しの翻訳の品質はあまり高くない. この問題に対して本研究では, 見出しを通常の表現形式に書き換える自動前編集系を既存のシステムに追加することによる解決を目指している. 見出しを通常の表現形式に書き換えれば, より品質の高い翻訳が, システムの既存部分にほとんど変更を加えることなく得られる. 例えば"Sales up sharply in June"という見出しは通常のシステムには受理されない可能性が高いが, "Sales were up sharply in June"のようにbe動詞"were"を補えば従来のシステムでも適切な翻訳が得られるようになる. 本稿では, 見出し特有表現の典型例の一つであるbe動詞の省略現象を対象とし, be動詞が省略されている見出しにbe動詞を正しく補うための書き換え規則を, 形態素解析と粗い構文解析によって得られる情報に基づいて記述する. この方法を, 我々が開発している英日翻訳支援システムPower E/Jに組み込み, 未知データの見出し312件を対象として実験を行なったところ, 再現率81. 2%, 適合率92. 0%の精度が得られた.

Since the headlines of English news articles have a characteristic style, different from the styles which prevail in ordinary sentences, it is difficult for MT systems to generate high quality translations for headlines. We try to solve this problem by adding to an existing system a preediting module which rewrites the headlines to ordinary expressions. Rewriting of headlines makes it possible to generate better translations which would not otherwise be generated, with little or no changes to the existing parts of the system. While most MT systems would not probably accept, for example, the headline "Sales up sharply in June", they would be able to generate a satisfactory translation of the expression "Sales were up sharply in June" where the verb "were" has been inserted. Focusing on a conspicuous phenomenon, the absence of a form of the verb of 'be', we have described rewriting rules for putting properly the verb'be' into the headlines, based on information obtained by morpholexical and rough syntactic analysis. We have incorporated the proposed method into our English-to-Japanese MT system Power E/J, and carried out an experiment with 312 headlines as unknown data. Our method has satisfactorily marked 81.2% recall and 92. 0% precision.

収録刊行物

  • 自然言語処理 = Journal of natural language processing

    自然言語処理 = Journal of natural language processing 7(2), 27-43, 2000-04-10

    一般社団法人 言語処理学会

参考文献:  11件中 1-11件 を表示

被引用文献:  1件中 1-1件 を表示

各種コード

  • NII論文ID(NAID)
    10008829616
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5437696
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ