スペクトルの時間変化に基づく音楽音響信号からの歌声成分の強調と抑圧 Enhancement and Suppression of Vocal Components in Music Audio Signals Based on Temporal Variability of Spectra

この論文にアクセスする

この論文をさがす

著者

    • 橘 秀幸 TACHIBANA HIDEYUKI
    • 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo
    • 小野 順貴 ONO NOBUTAKA
    • 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, The University of Tokyo

抄録

本稿では,歌声と楽器音を両方含むような音楽音響信号から,歌声成分を強調,または抑圧する信号処理手法について述べる.歌声に相当する成分を検出するために,本稿ではスペクトルの時間変化に由来するスペクトログラムの特徴的な形状に着目する.歌声にはスペクトルの時間変化や旋律的な動きがあるため,スペクトルの形状が長時間一定であることはなく,またこれらの時間変化の影響で歌声のスペクトルは周波数軸方向にある程度の幅を有するという点で特徴的である.このような特徴をスペクトログラムの異方性という観点から捉えると,歌声と楽器音の滑らかさは異方的であり,異方的な信号を分離する手法を使って歌声と伴奏を分離することができる。本稿ではそのような手法を具体的に提案し,実際の音楽信号を用いた実験を行った結果,聴感上,歌声成分が強調/抑圧された信号が得られることを確認した.We address a problem of enhancing or suppressing singing voice components in music audio signals. To achieve the purpose, we focus on peculiar spectral shapes of singing voice: they are not maintained unchanged for a while, and they occupy broad bandwidth, both of them is caused by spectral fluctuations and melodic nature of singing voice. When we regard those characteristic shapes as anisotropic smoothness of spectrogram, we can separate a music into singing voice and accompaniment, by applying a method which separates a signal into anisotropic components. In this paper, we propose a signal processing algorithm to enhance/suppress singing voice, based on those natures of spectral shapes of singing voice. We also conducted an auditory evaluation to confirm the effectivenes of the method using real music audio signals.

収録刊行物

  • 研究報告音楽情報科学(MUS)

    研究報告音楽情報科学(MUS) 2009-MUS-81(12), 1-6, 2009-07-22

    情報処理学会

参考文献:  11件中 1-11件 を表示

各種コード

  • NII論文ID(NAID)
    110007997346
  • NII書誌ID(NCID)
    AN10438388
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    024802727
  • NDL 請求記号
    YH247-911
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ