抄録
本稿では、統計翻訳のモデルを利用して最適訳選択を行う、構文トランスファ方式の用例翻訳器を提案する。従来用例翻訳は、原言語の類似度だけを利用して入力文と似た用例を選択していたため、翻訳文が誤ることがあった。本稿で提案する方式は、統計翻訳と同様に、翻訳モデルと言語モデルを利用して、入力文に最も適合する出力単語列を選択するため、用例翻訳単体に比べ、翻訳品質を向上させることができる。本方式の特徴の一つは、構文トランスファで語順変更を行った後にモデルを適用するため、語彙モデルだけでも翻訳品質を確保することが可能なことである。さらに、構文トランスファが出力する木構造を利用してボトムアップにモデルを適用することにより、翻訳速度を向上させた。
This paper presents example-based machine translation (MT) based on syntactic transfer, which selects the best translation by using models of statistical machine translation. Example-based MT sometimes generates invalid translations because it selects similar examples to the input sentence based only on source language similarity. The method proposed in this paper selects the best translation by using a language model and a translation model in the same manner as statistical MT, and it can improve MT quality over that of 'pure' example-based MT. A feature of this method is that the statistical models are applied after word re-ordering is achieved by syntactic transfer. This implies that MT quality is maintained even when we only apply a lexicon model as the translation model. In addition, translation speed is improved by bottom-up generation, which utilizes the tree structure that is output from the syntactic transfer.