映像検索におけるディープラーニング

書誌事項

タイトル別名
  • Deep Learning for Video Retrival

抄録

ディープラーニングは,画像の一般物体認識のタスクにおいて大成功を収めたことから,ビジョン系の多くの研究課題の中で用いられるようになってきた.近年では,画像の一般物体認識だけでなく,画像中にある物体を検出する,画像の説明文を生成する,画像の画風を変換するなど,様々な応用例が出てきている.また,静止画の認識だけに限らず,映像の意味理解や,映像検索の分野でも,多く使われるようになってきた.本稿では,大量映像からの検索技術を例に挙げ,そこで利用されている畳み込みニューラルネットワークと呼ばれるディープラーニングの活用方法を紹介する.現在,映像検索の学習に使用できる正解付けされた映像の量や質は,静止画に比べて十分ではないが,大量の静止画で学習された畳み込みニューラルネットワークから有益な特徴を抽出することで,映像検索の精度を向上させることが可能である.具体的な事例として,映像検索の中でも,映像に自動でタグ(意味索引)を付与する技術と,複数のキーワードの組み合わせからなるクエリ文を用いて映像を検索する技術を紹介する.

収録刊行物

参考文献 (7)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ