音声情報と画像情報の併用による商品紹介映像のセグメンテーション  [in Japanese] Segmentation of Goods Catalog Video into Individual Goods Section by Combination of Speech and Image Information  [in Japanese]

Search this Article

Author(s)

Abstract

本研究では,社内で製作された商品の紹介映像を対象とした,個々の商品区間へ分割するとともに商品名を索引として付与するシステムを提案する.本研究におけるシステムでは,商品紹介映像に含まれる音声を認識することにより抽出された重要単語(商品名)を用いて,映像の分割と索引の付与を行う.音声認識により商品名を抽出するには,音声認識用の辞書に商品名が事前に登録されている必要がある.しかし多くの場合,対象としている映像にどのような商品が含まれているかということは事前には未知である.このため本研究では,映像中に出現するテロップ文字を認識して商品名の候補を自動的に抽出し,音声認識によって商品名を確定する方法を採用する.つまり本手法は,音声情報と映像情報を併用した映像分割手法であり,それぞれの情報を単独で用いる場合に比べて,わき出しを削減し,高い分割精度を得ることができる.

Journal

  • The IEICE transactions on information and systems

    The IEICE transactions on information and systems 89(2), 292-304, 2006-02-01

    The Institute of Electronics, Information and Communication Engineers

References:  19

Codes

  • NII Article ID (NAID)
    110004669948
  • NII NACSIS-CAT ID (NCID)
    AA12099634
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    18804535
  • NDL Article ID
    7795121
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-779
  • Data Source
    CJP  NDL  NII-ELS 
Page Top