TL2000-9 マルチモーダル対話コーパスのタグ付きデータ部分公開に向けて Toward the publication of the second version of The Multi-Modal Dialogue Corpus

    • 石崎 俊 ISHIZAKI Shun
    • 慶應義塾大学大学院政策・メディア研究科 Graduate School of Media and Governance Keio University

抄録

(社)日本電子工業振興協会対話理解技術専門委員会は、広い意味での対話処理の研究開発に資するため、対話データの収集と構造化を実施し、その成果であるタグ付き対話コーパスを公開するとともに、その収集および構造化の方法に関する提言を発信することを目的として活動している。今年度は昨年度までに作成したマルチモーダル対話コーパスの配布を進めるとともに、このデータに対するタグ付け作業をほぼ完了し、2000年6月にタグ付きコーパスを部分公開する予定である。本報告ではマルチモーダルデータ構造化の諸相という観点から、人間の言語行動における複数モダリティー(統語構造・共参照、対話構造、韻律、表情)の構造化技法と構造化データの性質について報告する。

The Multi-Modal Dialogue Corpus is a corpus of unscripted, task-oriented dialogues which has been digitally recorded, and transcribed to support the study of human face-to-face multi-modal dialogue. The particularity of present corpus is the collection of Dialogues in the high quality video format. The first version of the corpus published last year occupies 2 CD-ROMs, and contains:a complete set of transcripts in a plane-text format;a complete set of audiovisual data in the MPEG1 format;images of all materials in the JPEG format;basic documentation in the HTML-text format. The task to develop annotation scheme and annotate the corpus in several levels-phonological transcription of prosody, body movement coding, syntactic and semantic annotation, and discourse tagging-is in progress. The second version of the corpus will be published in the month of June 2000, including annotated transcripts.

収録刊行物

電子情報通信学会技術研究報告. TL, 思考と言語   [巻号一覧]

電子情報通信学会技術研究報告. TL, 思考と言語 100(187), 17-24, 2000-07-07  [この号の目次]

社団法人電子情報通信学会

参考文献:  13件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  1件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110003314367
  • NII書誌ID(NCID) :
    AN10449078
  • 本文言語コード :
    JPN
  • 資料種別 :
    ART
  • ISSN :
    09135685
  • NDL 記事登録ID :
    5479600
  • NDL 雑誌分類 :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号 :
    Z16-940
  • 収録DB :
    CJP書誌  CJP引用  NDL  NII-ELS