映像認識理解への認知発達的アプローチ  [in Japanese] Cognitive developmental approach towards the realization of human-like visual scene understanding  [in Japanese]

Search this Article

Author(s)

    • 木村 昭悟 KIMURA Akisato
    • 日本電信電話(株)NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, NTT Corporation
    • 柏野 邦夫 KASHINO Kunio
    • 日本電信電話(株)NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, NTT Corporation
    • 福地 賢 [他] FUKUCHI Ken
    • 国立 沖縄工業高等専門学校 情報通信システム工学科 Department of Information and Communication Systems Engineering, Okinawa National College of Technology
    • 赤嶺 一馬 AKAMINE Kazuma
    • 国立 沖縄工業高等専門学校 情報通信システム工学科 Department of Information and Communication Systems Engineering, Okinawa National College of Technology
    • 高木 茂 TAKAGI Shigeru
    • 国立 沖縄工業高等専門学校 情報通信システム工学科 Department of Information and Communication Systems Engineering, Okinawa National College of Technology

Abstract

人間は、特に意識をしなくとも、見た映像を理解し言語化でき、与えられた映像群の中から自身の思い描く映像を的確に見つけ出すことができる。しかし、これらのタスクを計算機に代行させる映像認識理解問題や映像検索問題は、パターン認識分野における早期からの最重要課題の1つでありながら、未だ本質的な解決に至っていない。ただ、人間も映像認識・理解・検索の能力を先天的に兼ね備えているとは考えにくく、その大部分が成長の過程で後天的に身に付けていく性質のものであると考えられる。本報告では、この点に着目し、認知発達的アプローチに基づく新しい映像認識理解、特にそのための知識獲得戦略のあり方を提案する。本報告で提案する枠組において、従来のアプローチと異なる特に重要な点は、以下の2点である。(1)映像の認識・理解に必要な知識の能動的かつ自律的な獲得、(2)自らの発達段階に応じた知識獲得戦略の動的遷移。本報告では、このアプローチの初期的な試みとして、発達初期段階における乳幼児の典型的な行動を参考にして作成した知識獲得システムのプロトタイプについて紹介すると共に、提案する枠組の具体的な方向性とその実現可能性について議論する。

How do we humans understand visual scenes so easily and quickly? While it looks difficult to answer this question, human babies naturally acquire the ability to do it. This fact might imply that imitating typical actions and strategies of human babies is a promising approach to the visual scene understanding. Thus, we adovocate a new framework of visual scene understanding that will be able to acquire the ability naturally. The most important issues we would note in the proposed framework are (1) autonomous acquisition and organization of knowledge through active (i.e. system-driven) interactions, and (2) smooth transition of strategies to acquire a wide variety of knowledge according to the developmental stages. We develop a prototype of a visual scene understanding system, which currently includes several functions of the primary developmental step, such as bottom-up object detection, recognition and incremental supervised learning. We also discuss some possible future directions to realize human-like visual scene understanding in this talk.

Journal

  • IEICE technical report

    IEICE technical report 109(344), 37-42, 2009-12-10

    The Institute of Electronics, Information and Communication Engineers

References:  29

Cited by:  1

Codes

  • NII Article ID (NAID)
    110008002723
  • NII NACSIS-CAT ID (NCID)
    AN10541106
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09135685
  • NDL Article ID
    10510829
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top