次投稿予測モデルを用いた想起関係の自動抽出

書誌事項

タイトル別名
  • Automatic Extraction of Evocations by Predicting Model of Next Posts

この論文をさがす

抄録

想起とは,ある概念が別の概念をどの程度思い浮かばせるかを表した重み付き情報であり,様々なアプリケーションへの応用が期待されている.一般に,人間の知覚や経験に強く依存する意味関係は,構造的な意味関係と比べ,その抽出が困難であると考えられており,想起関係においても研究の余地を多分に残している.そこで本研究では,教師なし学習による想起関係の自動抽出を試みる.従来のアプローチでは,単語の共起情報を利用した手法が報告されているが,想起関係は方向性のあるデータであるため,共起情報のみでは不十分と考えられる.本論文では,コーパス内投稿データの話題遷移情報を利用した想起関係の自動抽出手法を提案する.また,英語と日本語による想起評価データを用いた実験を行い,従来手法との性能比較結果を示す.実験の結果,提案モデル単体では従来モデルと同程度以上の性能であること,また,両者をアンサンブルすることで性能が大幅に向上することを報告する.これより,従来では用いられなかった想起の方向性を考慮した想起抽出モデルの作成が重要であることを示唆する.

Evocation is weighted information that expresses how much a concept evokes another, and its application to various tasks is expected. In general, the extraction of semantic relationships strongly depending on human perception and experience is considered to be more difficult than the extraction of structural semantic relationships, and there is much room for researches in evocation relationships as well. So, in this paper, we try an extraction method of evocation relations using unsupervised learning. Conventionally, a method using co-occurrence relation of words has been reported. However, since evocation relations are directional, the co-occurrence information alone is considered to be insufficient. Therefore, this paper proposes an extraction method of evocation relation using the transition information of post data in corpus. We also conduct the experiments using evocation evaluation data in English and Japanese, and we compare the performance of proposed method with that of the conventional method. As a result, it shows that the performance of the proposed model is as high as or higher than that of the conventional one, and it can be further improved by their ensemble. This result suggests that it is important to create an evocation extraction model that takes into account the direction of evocation, which was not considered in the conventional method.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050003824990724096
  • NII論文ID
    170000183277
  • NII書誌ID
    AA11464803
  • ISSN
    18827780
  • Web Site
    http://id.nii.ac.jp/1001/00206593/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ