自動生成された言い換え文における不適格な動詞格構造の検出(自然言語) Detection of Incorrect Case Assignments in Automatically Generated Paraphrases (Natural-Language Processing)

    • 藤田 篤 FUJITA ATSUSHI
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and・Technology
    • 乾 健太郎 INUI KENTARO
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and・Technology
    • 松本 裕治 MATSUMOTO YUJI
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and・Technology

抄録

本論文では,語彙・構文的言い換えにおいて頻繁に生じる動詞格構造の不整合を自動的に検出する方法を提案する.我々は,コーパスから獲得した大規模な正例に基づいて格構造の適格さを定量化する確率的言語モデルと,人手で収集した小規模な負例に基づいて格構造の不適格さを定量化するモデルを構築し,これら2つを混合し,正例のみに基づく言語モデルと比較して精度の高い誤り検出器を実現した.また,誤り検出に対して貢献度が高い負例を効率良く収集するために能動学習を試行した.

This paper addresses the issue of detecting transfer errors in paraphrasing. Our previous investigation revealed that case assignment of verb tends to be incorrect, irrespective of the types of lexical and structural paraphrasing of Japanese sentences. Motivated by this observation, we propose an empirical method to detect incorrect case assignment. Our error detection model combines two error detection models. They are separately trained on a large collection of positive examples and a small collection of manually labeled negative examples. Experimental results show that our combined model significantly enhances the baseline model which is trained only on positive examples. We also propose a selective sampling scheme to reduce the cost of collecting negative examples, and confirm the effectiveness for the error detection task.

収録刊行物

情報処理学会論文誌   [巻号一覧]

情報処理学会論文誌 45(4), 1176-1187, 2004-04-15  [この号の目次]

一般社団法人情報処理学会

参考文献:  28件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  7件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110002712165
  • NII書誌ID(NCID) :
    AN00116647
  • 本文言語コード :
    JPN
  • 資料種別 :
    ART
  • ISSN :
    03875806
  • NDL 記事登録ID :
    6919506
  • NDL 雑誌分類 :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号 :
    Z14-741
  • 収録DB :
    CJP書誌  CJP引用  NDL  NII-ELS