英日機械翻訳における代名詞翻訳の改良 Improvement of Translation Quality of Pronouns in an English-to-Japanese MT System

この論文にアクセスする

この論文をさがす

著者

    • 吉見 毅彦 YOSHIMI TAKEHIKO
    • シャープ(株)技術本部 システム開発センター Corporate Research and Development Group, System Technology Development Center, SHARP Corporation

抄録

代名詞を含む英文を日本語として適格で自然な文に翻訳するためには, 英語の代名詞を日本語の代名詞としてそのまま表現せず, ゼロ代名詞化したり他の表現に置き換えたりする必要がある. ゼロ代名詞化に関しては, 人手で記述された規則による方法が既に提案されている. 本稿では, 1) ゼロ代名詞化に加え, 他の表現に置き換えるべき場合も扱い, 2) 規則を人手で記述するのではなく, 決定木学習によって自動的に学習する方法を示す. 学習に利用する属性は, ゼロ代名詞化に関してこれまでに解明されている言語学的制約や, ゼロ代名詞の復元に関する工学的研究で着目された手がかりを参考にして選択した. 提案手法を我々の英日機械翻訳システムPower E/Jによる訳文に対して適用したところ, ゼロ代名詞化するか否かの判定を行なう場合の精度が79.9%, ゼロ代名詞化するか否かに加え他の表現に書き換えるか否かの判定も行なう場合の精度が72.2%となり, 人手で記述された規則の精度に近い精度が得られた. また, 選択した属性には, 書き換え精度を低下させる属性は含まれておらず, ゼロ代名詞化に関する言語学的制約だけでなく, ゼロ代名詞の復元に関する手がかりも利用できることが明らかになった.

In order to translate sentences of English containing pronouns into natural and suitable Japanese, it is frequently necessary either to eliminate pronouns or to turn them into some other expressions. As for eliminating unwanted pronouns, a set of manually-written rules has already been presented. In this article we propose to 1) offer a way of substituting unwanted pronouns for other expressions as well as eliminating them, and 2) use a decision tree learning algorithm to learn rules automatically from a corpus, without requiring human intervention. The features used for learning are selected from the linguistic constraints we have so far understood which apply on zero pronominalisation, and from the clues which have been used for anaphora resolution of zero pronouns in the engineering studies. Having applied the proposed method to the translation results of our English-to-Japanese machine translation system Power <I>E/J</I>, we found that in the cases where the judgement whether zero pronominalisation should be applied the accuracy of translation was 79.9%, where in addition to the above judgement the substitution of pronouns for other expressions was applied the accuracy was 72.2%. These results are well comparable with those obtained by hand-written rules. It also became clear that none of the selected features lowers the accuracy, which means we can use as features for our purpose not only the linguistic constraints on zero pronominalisation but also the clues for restoring zero pronouns.

収録刊行物

  • 自然言語処理 = Journal of natural language processing  

    自然言語処理 = Journal of natural language processing 8(3), 87-106, 2001-07-10 

    一般社団法人 言語処理学会

参考文献:  25件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  1件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10021991494
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5841027
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ