音声認識を用いた高精度なシーン分割に関する一検討 : 撮像物体の対応付けによる動画像の構造解析の導入(コンシューマ,映像メディアおよび一般)  [in Japanese] A Note on Accurate Scene Segmentation Utilizing Speech Recognition : Introduction of Video Structure Analysis Using Object Matching  [in Japanese]

    • 成田 容 NARITA Yo
    • 北海道大学大学院情報科学研究科 Graduate School of Information Science and Technology, Hokkaido University

Abstract

本文では,音声認識結果に基づく新たな特徴量を定義し,その特徴量を用いてシーン分割の高精度化を行う手法を提案する.提案手法では,処理対象映像中の固定長の小区間において,音声認識結果から得られる単語の出現分布に基づき新たな特徴量を定義する.さらに,この特徴量を用いることで算出される区間同士の類似度を話題の類似度として定義する.この話題の類似度の時間変化から話題が切り替わるおよその時刻が検出されるため,その時刻に注目することで,既存のシーン分割手法との併用によりシーンカットの過剰検出を抑制することが可能となる.その結果,従来よりも映像の内容に基づいた高精度なシーン分割が実現される.

This paper proposes an improvement method for scene segmentation which uses new features defined from speech recognition result. In the proposed method, the new features are defined based on the appearance distribution of terms in fixed-length short segments of video materials. Furthermore, similarities between two segments are calculated from the obtained features as similarities of topics. Then, the changes of topics are detected from the time transition of the similarities, and the problem of over segmentations caused in the traditional methods can be alleviated by combining both their methods and our method. Finally, the proposed method realizes accurate scene segmentations based on the topics of video materials.

Journal

ITE Technical Report   [List of Volumes]

ITE Technical Report 33(33), 17-20, 2009-08-03  [Table of Contents]

The Institute of Image Information and Television Engineers

References:  6

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110007360920
  • NII NACSIS-CAT ID (NCID) :
    AN1059086X
  • Text Lang :
    JPN
  • Article Type :
    ART
  • ISSN :
    13426893
  • NDL Article ID :
    10364889
  • NDL Source Classification :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No. :
    Z16-1010
  • Databases :
    CJP  NDL  NII-ELS