広域特徴と狭域特徴を用いた画像情報の部分欠損に頑健な歩行者検出

書誌事項

タイトル別名
  • Occlusion Robust Pedestrian Detection with Global and Local Features

この論文をさがす

抄録

本論文では,車載カメラ画像に対する歩行者検出の精度改善を目的として,広域特徴と狭域特徴を用いた検出器の構造を提案する.歩行者検出タスクの課題として,(1)オクルージョン発生時,(2)夜間における精度低下があげられる.(1),(2)の状況は,いずれも歩行者の見かけに関する情報の欠損を招く点で共通している.我々は,既存手法が単一かつ大きいサイズの受容野(特徴量を計算する過程で,入力画像に対して参照される範囲)のみを持つCNNに依存することに問題があると考える.したがって,本研究では,受容野に着目し,異なるサイズの様々な受容野を兼ね備えるCNNを構築することにより,問題の改善を目指す.具体的には,画像上の広域的な特徴を表現可能なCNNであるVggNet(受容野が大きい)と,狭域的な特徴を表現可能なCNNであるBagNet(受容野が小さい)の双方をR-CNNの構造内に取り入れ,それぞれの特徴量を組み合わせて活用する.複数のデータセットにおいて評価実験を行った結果,提案手法により,見かけの情報が部分的に欠損した歩行者に対する特徴表現能力の強化および歩行者検出精度の改善が確認された.

We propose a novel pedestrian detector which utilizes both global features and local features. Traditional CNN based pedestrian detectors have difficulties in dealing with scenes of severe occlusions or in the night time, mainly due to the information loss that caused by using a single CNN with a relatively large receptive field. In the proposed approach, we utilize both the VggNet and the BagNet, which are designed to have large and small receptive fields respectively, to capture information from the input images in different scales. We evaluated the proposed approach on multiple pedestrian detection datasets and confirmed its effectiveness.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ