複数決定木を用いた入力誤りに頑健な省略補完手法  [in Japanese] Multiple Decision-Tree Strategy for Ellipsis Resolution with Input-Error Robustness  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

日本語は主語などの要素がしばしば省略されるため, これらの補完は対話処理において重要である. さらに音声対話処理においては, 実際に対話を処理する際に入力となるのは音声であり, 一部誤りを含んだ音声認識結果が処理対象となるため, 言語処理部においても不正確な入力に対する頑健性が要求される. このため, 入力の一部に誤りのある状況下における格要素補完問題を考え, 以前に提案した決定木を使用した補完手法を改良したモデルを提案する. このモデルは, 複数の決定木を使用することで複数解候補を出力し, その中から学習時の終端節点事例数によって解の選好を行なうことで入力誤りに対する頑健性を強化した. 音声認識の実誤りと人工的な誤りの2種類で評価実験を行なった結果, 提案手法が誤りを含む入力に対し頑健であることを確認した. また人工的な問題に対するシミュレーションの結果, 本提案手法は問題非依存であり, 入力誤りの多さに応じた決定木の組み合わせでモデルを構成することで有効に機能することが明らかとなった.

In Japanese spoken language processing, the subject and other cases are often omitted. Several approaches to resolve such an ellipsis have been proposed so far, but none of them have considered robustness against noisy input. It is important to also have some robustness in an ellipsis resolution module, since the inputs of the process are the results of a speech recognition module, which may have some recognition errors in spoken dialogue processing. We thus propose a robust model of ellipsis resolution which utilizes a multiple decision tree (MDT) model. Experimental results have proven its robustness, and have also shown that the model is task-independent and works more effectively if we provide decision trees with the number of attributes corresponding to the amount of noise.

Journal

  • Journal of Natural Language Processing

    Journal of Natural Language Processing 7(4), 181-204, 2000-10-10

    The Association for Natural Language Processing

References:  16

Cited by:  5

Codes

  • NII Article ID (NAID)
    10008830004
  • NII NACSIS-CAT ID (NCID)
    AN10472659
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13407619
  • NDL Article ID
    5544283
  • NDL Source Classification
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL Call No.
    Z21-B168
  • Data Source
    CJP  CJPref  NDL  J-STAGE 
Page Top