映像閲覧行動の時空間ずれ構造モデルを用いた注視点予測 (情報論的学習理論と機械学習)  [in Japanese] Gaze Point Prediction with Gap Structure Models  [in Japanese]

Search this Article

Author(s)

Abstract

人間が一般の映像を閲覧する状況では,映像中において人間の視覚的注意を引きつける顕著領域と,実際の注視点との間に時空間的なずれが生まれる.このずれは,顕著領域の変動(顕著性変動)に対する反応遅れや動き予測に起因するものであり,変動の種類によってその程度が異なる.本研究では,顕著領域・注視点間のずれが持つ構造と顕著性変動の関係性に基づいて,映像から注視点を予測する手法を提案する.提案手法は,注視点に対して時空間ずれをともなって観測される顕著性変動パターンを,単純な変動パターンの組み合わせによって表現する.これにより,「注視点の近傍でどのような顕著性変動パターンがどのような時空間ずれとともに観測されやすいか」をデータドリブンに学習することによる注視点予測が実現できる.

When we are watching videos, there exist spatiotemporal gaps between salient regions that attract visual attention and actual points of gaze. These gaps result from reaction delays or anticipation in eye movements toward dynamic changes of the salient regions (saliency dynamics). In this paper, we exploit the underlying structures of the gaps for gaze point prediction from videos. The proposed method involves the relationships between the gaps and the saliency dynamics by introducing localized primitive patterns of salient regions for the description of saliency dynamics. It enables us to learn ``what types of saliency dynamics can be observed around the points of gaze'' in a data-driven fashion for the gaze point prediction.

Journal

  • 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(197), 57-62, 2013-09-02

    The Institute of Electronics, Information and Communication Engineers

Codes

  • NII Article ID (NAID)
    110009784536
  • NII NACSIS-CAT ID (NCID)
    AA12482480
  • Text Lang
    JPN
  • ISSN
    0913-5685
  • NDL Article ID
    024926481
  • NDL Call No.
    Z16-940
  • Data Source
    NDL  NII-ELS 
Page Top