ミュージカル映画中の音声区間検出 Voice Activity Detection in Captioning Musical Films

この論文にアクセスする

この論文をさがす

著者

抄録

The process of detecting portions involving utterances, which is essential for captioning films, is generally carried out manually by translators at present. Robust methods are inevitable for automatic voice activity detection (VAD) in films involving other irrelevant sound information such as background music. This paper proposes a new feature for automatic VAD. The proposed method utilizes the gradient of spectrum in high-frequency domain (4-6kHz) and the standard deviation of modulation-filtered cepstrum. For evaluation experiments, we used a portion (about 23 minutes) of an English musical film. The proposed method exhibits a 22.6% reduction in total error rate compared to the conventional one utilizing the short time energy.

収録刊行物

  • 石川工業高等専門学校紀要

    石川工業高等専門学校紀要 39(0), 51-56, 2007

    独立行政法人 石川工業高等専門学校

各種コード

  • NII論文ID(NAID)
    110006407980
  • NII書誌ID(NCID)
    AN00014363
  • 本文言語コード
    JPN
  • ISSN
    0286-6110
  • NDL 記事登録ID
    8898754
  • NDL 雑誌分類
    ZM2(科学技術--科学技術一般--大学・研究所・学会紀要)
  • NDL 請求記号
    Z14-410
  • データ提供元
    NDL  NII-ELS  J-STAGE 
ページトップへ