歌唱音声の類似度評価を目的とした声質に関する音声特徴量の提案 (音声)  [in Japanese] A proposal of acoustic feature related to voice quality for estimation of similarity in singing voice  [in Japanese]

Search this Article

Author(s)

Abstract

本報告では,歌唱音声における類似度を測る音声特徴量の検討を行なう.今回は,歌唱者の声質とビブラート部分のスペクトル変動に着目し,それぞれに関する音声特徴量を用いて類似度の評価を行なう.比較に用いた歌声データは,歌い方や声質が特徴的だと思われる目標の歌手を物真似した歌声と,物真似していない歌声である.そして,CD音源から目標の歌手の歌声のみを抽出した歌声を用いて比較を行なった.比較に用いた音声特徴量は,歌唱者の声質に関してはフォルマントの分布である.また,ビブラート部分のスペクトル変動に関しては,ケプストラム歪,スペクトル重心の変動である.フォルマントの分布の変動の比較により,いくつかの音素の分布がCD音源の分布に近づいており,歌唱者の声質が目標歌手に近づいていることが分かった.また,ビブラート部分のスペクトル変動については,ケプストラム歪の比較より,物真似ありの方がCD音源に近づいていることが分かった.さらに,スペクトル重心の変動の比較では,物真似ありの方が物真似なしより大きな変動をしておりCD音源の変動に近いことが明らかとなった.以上より,物真似ありの音声が,声質及びビブラート部分のスペクトル変動ともに目標歌手に近づいていることを示せた.

This report proposes an acoustic feature set to evaluate similarity in singing voice. This study focuses on voice quality of a singer and spectral fluctuation in vibrato and evaluates similarity by using features related to the voice quality and the spectral fluctuation. The data used in the evaluation includes non-imitative singing voice and imitative singing voice of target singer, whose voice and singing style have strong individuality. The data also includes the target singer's voice extracted from CD. The acoustic feature for comparing voice quality between input and target singers is distribution of formant frequencies. The acoustic features for comparing spectrum fluctuation of vibrato are cepstral distortion and time series of spectral centroid. By comparing distributions of formant frequencies, since distributions of many vowels in imitative singing were close to that of CD, it can be concluded that voice quality of imitative singing is close to that of the target singer. In investigating spectral fluctuation of vibrato, it also can be concluded that imitative singing is close to singing of the target singer in spectral fluctuation of vibrato, by comparing cepstral distortion and time series of spectral centroid.

Journal

  • IEICE technical report. Speech

    IEICE technical report. Speech 111(365), 79-84, 2011-12-19

    The Institute of Electronics, Information and Communication Engineers

Codes

  • NII Article ID (NAID)
    110009466809
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • ISSN
    0913-5685
  • NDL Article ID
    023376168
  • NDL Call No.
    Z16-940
  • Data Source
    NDL  NII-ELS 
Page Top