学習による映像中の一般音源同定 Sound Source Detection

この論文をさがす

著者

    • 池田 千廣 IKEDA Chihiro
    • 九州大学大学院システム情報科学府 Graduate School of Information Science and Electrical Engineering, Kyushu University
    • 内田 誠一 UCHIDA Seiichi
    • 九州大学大学院システム情報研究院 Faculity of Information Science and Electrical Engineering, Kyushu University

抄録

本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoostを用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音特徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した.

The purpose of this paper is to consider a sound source detection method.

収録刊行物

  • 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 110(467), 67-72, 2011-03-03

    一般社団法人電子情報通信学会

参考文献:  11件中 1-11件 を表示

各種コード

  • NII論文ID(NAID)
    110008690119
  • NII書誌ID(NCID)
    AN10541106
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    11048182
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ