意味的用法に着目した日本語名詞の英訳語選択について

書誌事項

タイトル別名
  • イミテキ ヨウホウ ニ チャクモク シタ ニホンゴ メイシ ノ エイヤクゴ センタク ニ ツイテ
  • English Word Selection for Japanese Nouns Using Semantic Usage
  • 自然言語

この論文をさがす

抄録

日英機械翻訳において精度良い名詞の訳語選択技術を実現するため,日本語の基本的な名詞の英訳語の多義構造について調査し,名詞の「意味的用法」に関する分類知識(文中での名詞の用法の意味的な分類)を使用した訳語選択の可能性について検討した.具体的には,まず,IPAL辞書に収録された名詞1 082語を対象に,和英辞書を使用して名詞の持つ英訳語数の静的な分布を調べるとともに,新聞記事1万文の対訳コーパスを対象に,使用頻度の高い名詞についての訳語数の動的な分布を調べた.次に,複数の英訳語を持つ名詞(「訳語多義語」という)を対象に,「意味的な用法」として「日本語語彙大系」で定義された「一般名詞意味属性」(単に「意味属性という」)を使用した場合の訳語選択精度を調べた.また,その結果を基に「意味的用法」を使用した名詞訳語選択の限界と,それ以外で必要と考えられる知識について考察した.その結果によれば,IPAL辞書の名詞では複数の訳語を持つものは約5割(499語)で,そのうち55%は「意味属性」の知識によって一意に訳語が決定できること,また,それを含む87%は,訳語候補が絞り込めることが分かった.訳語多義語の平均多義数は3.02から1.74に減少し,訳語正解率は38.7%から78.6%に向上する.新聞記事で使用頻度の大きい名詞では,訳語多義数の平均が3.0から1.4に減少し,訳語正解率は53.8%から92.2%に向上する.なお,失敗用例の分析では「意味属性体系」の改良で最大約6%程度の精度向上が見込まれることから,これが名詞の「意味的用法」の知識を使用した方法の限界と推定される.

Translation word selection,especially for nouns, is one of the most important issues in machine translation.This paper studied the capability of English word selection for basic Japanese nouns using information of semantic usage.In this study, basic nouns of 1,082 words registered in IPAL dictionary were used for evaluation.The results are as follows.Translation of 55% out of 499 words which have multiple translation words can uniquely be determined by using the information of semantic usage.The number of translation candidates can be reduced for 87% of 499 words.In the study of newspaper article translation,the average value of the word ambiguity can be reduced from 3.0 to 1.4 by this method.

収録刊行物

参考文献 (33)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ