日本語-ウイグル語対訳辞書拡充のための日本語言い換え処理  [in Japanese] Paraphrasing Japanese Words to Expand a Japanese-Uighur Bilingual Dictionary  [in Japanese]

Search this Article

Author(s)

Abstract

本稿では、対訳辞書における未登録語を登録単語に言い換えることにより、辞書を拡充する手法を提案する。本手法では、言い換え処理を、収集段階と選択段階の二段階に分割する。収集段階では、国語辞書の語義文を用いて、言い換え候補を収集する。選択段階では、語構成の見地から、言い換え前後の語句間の類似度を計算し、意味的に適切な候補を選択する。また、本手法により、実際に日本語ウイグル語対訳辞書を拡充する実験を行った結果、未登録語300単語中68.3%が、対訳として用いることの可能な言換えを獲得できた。

In machine translations, the number of words in bilingual dictionary has an important influence on the translation. However, a cost of a dictionary development is very expensive. In this paper, we resolve this problem by paraphrasing a non-entry word into the entry words. We divide the paraphrasing process into two steps: collecting and screening. In the collecting step, we make paraphrasing expressions of an original word by using its lexical descriptions in a Japanese monolingual dictionary. In the following screening step, we calculate the similarity between the original word and each of its paraphrasing expressions, and choose the best one. We applied this method to our Japanese-Uighur bilingual dictionary. As a result, for 68.3% of non-entry words, the appropriate Uighur words were given.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 154, 55-62, 2003-03-06

    Information Processing Society of Japan (IPSJ)

References:  8

Codes

  • NII Article ID (NAID)
    110002911592
  • NII NACSIS-CAT ID (NCID)
    AN10115061
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09196072
  • NDL Article ID
    6547035
  • NDL Source Classification
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  NDL  NII-ELS 
Page Top