2段階のクラウドソーシングによる談話関係タグ付きコーパスの構築
書誌事項
- タイトル別名
-
- Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing
この論文をさがす
抄録
本稿では、クラウドソーシングを活用することによって、談話関係タグ付きコーパスを構築する手法を提案する。談話関係のタグ付けは従来は非常に長い時間とコストがかかるものであったが、提案手法ではこれを 2 段階のクラウドソーシングのタスクに分けることによって短時間で構築する。1 文書が 3 文からなる短い日本語テキストを対象としてクラウドソーシングを行い、1 万文書 (3 万文) からなるコーパスが 8 時間弱で構築できることを示す。また、構築したコーパスを利用して談話関係解析器を開発し、コーパスの有用性を示す。
収録刊行物
-
- 情報処理学会研究報告. 自然言語処理研究会報告
-
情報処理学会研究報告. 自然言語処理研究会報告 2014 (12), 1-7, 2014-06-26
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1572824502785188224
-
- NII論文ID
- 110009799606
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles