認識候補から正解テキストへの翻訳に基づく講演音声ドキュメントのアドホック検索 An Ad-hoc Retrieval Method for Lecture Speech by Translating Recognition Candidates into Correct Transcriptions

この論文にアクセスする

この論文をさがす

抄録

音声ドキュメントを対象としたアドホック検索は,大語彙連続音声認識を用いて対象音声ドキュメントをテキストへと変換すれば,既存のテキストを対象とする検索手法がそのまま適用可能である.その際に問題となるのは,音声認識誤りの影響による自動書き起しテキストの劣化の問題がある.この問題に対し,本研究では,音声認識による自動書き起しと人手書き起しの間の差異を「翻訳」によって補完する検索手法を提案する.提案手法の効果を調べるため,日本語話し言葉コーパス(CSJ)を検索対象としたテストコレクションで評価実験を行った.その結果,提案手法は,特に小さいサイズの文書を検索対象とするタスクにおいて良い性能を示すことが分かった.This paper proposes an ad hoc retrieval method for spoken documents that uses a statistical translation technique. After transcribing the spoken documents by using a Large-Vocabulary Continuous Speech Recognition (LVCSR) decoder, a text-based ad hoc retrieval method can be directly applied to the transcribed documents. However, recognition errors will significantly degrade the retrieval performance. To address such a problem, the proposed method aims to fill the gap between the automatically transcribed text and the correctly transcribed text by using a statistical translation technique. To investigate the effectness of the proposed method, we conducted an ad hoc retrieval experiment targeting the Corpus of Japanese Spontaneous Speech.The experimental evaluation shows that the proposed method performs better than the baseline ad hoc retrieval method using only the transcribed text, especially for retrieval tasks with relatively small target documents.

収録刊行物

  • 情報処理学会論文誌

    情報処理学会論文誌 50(2), 514-523, 2009-02-15

    情報処理学会

被引用文献:  2件中 1-2件 を表示

各種コード

  • NII論文ID(NAID)
    110007970347
  • NII書誌ID(NCID)
    AN00116647
  • 本文言語コード
    JPN
  • 資料種別
    Journal Article
  • ISSN
    1882-7764
  • NDL 記事登録ID
    024214953
  • NDL 請求記号
    YH247-743
  • データ提供元
    CJP引用  NDL  NII-ELS  IPSJ 
ページトップへ