2段階のクラウドソーシングによる談話関係タグ付きコーパスの構築

書誌事項

タイトル別名
  • Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing

この論文をさがす

抄録

本稿では、クラウドソーシングを活用することによって、談話関係タグ付きコーパスを構築する手法を提案する。談話関係のタグ付けは従来は非常に長い時間とコストがかかるものであったが、提案手法ではこれを 2 段階のクラウドソーシングのタスクに分けることによって短時間で構築する。1 文書が 3 文からなる短い日本語テキストを対象としてクラウドソーシングを行い、1 万文書 (3 万文) からなるコーパスが 8 時間弱で構築できることを示す。また、構築したコーパスを利用して談話関係解析器を開発し、コーパスの有用性を示す。

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1572824502785188224
  • NII論文ID
    110009799606
  • NII書誌ID
    AN10115061
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ