アクティベーション共有型非負値行列因子分解を用いた混合音源中の音像深度推定 (応用音響 音響・超音波サブソサイエティ合同研究会) Depth Estimation of Sound Images in Mixed Source Using Activation-Shared Nonnegative Matrix Factorization

この論文をさがす

著者

抄録

波面合成法(WFS)は,高品質な音場再現を実現する技術である.しかし,WFSにより個々の音像の再現を行うためには,混合信号中の対象音源の特定位置情報が必要となる.受聴者から音源が遠い音場では,拡散により音波が様々な方向から到来する.したがって,目的音の到来方向(DOA)分布の形状は,深度推定のための手がかりとして用いることができる.本稿では,DOA分布の変化を利用した新たな音像深度推定手法を提案する.また,特徴量抽出手法として,アクティベーション共有型非負行列因子分解を提案する.これにより,目的音の方位情報を保存しつつ,背景雑音と信号処理により生成された人工的な歪みの影響を排除することが可能となる.客観評価実験により,提案手法の有効性を示す.

Wave field synthesis (WFS) is a technique for realizing high quality sound reproduction. However, WFS requires specific localization information of the objective sound sources in a mixed signal to reproduce the individual sound images. In sound fields, when a sound source is far from the listener, sound waves arrive from various directions owing to sound diffusion. Therefore, the shape of the direction of arrival (DOA) distribution of the target source can be used as a cue for depth estimation. In this paper, we propose a new depth estimation method, which utilizes the variation of DOA. In addition, we propose an activation-shared nonnegative matrix factorization as the feature extraction method. By using this method, we can eliminate the effect of background noise and artificial distortion generated by signal processing while maintaining directional information. From the experimental results, we can confirm the efficacy of the proposed method.

収録刊行物

  • 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(413), 81-86, 2014-01-27

    一般社団法人電子情報通信学会

各種コード

  • NII論文ID(NAID)
    110009825586
  • NII書誌ID(NCID)
    AN10164817
  • 本文言語コード
    JPN
  • ISSN
    0913-5685
  • NDL 記事登録ID
    025278095
  • NDL 請求記号
    Z16-940
  • データ提供元
    NDL  NII-ELS 
ページトップへ