テンポの変化による影響を考慮した歌唱音声合成に関する検討  [in Japanese] Singing Voice Synthesis Taking Account of Tempo Effect  [in Japanese]

Search this Article

Author(s)

Abstract

子音を含む歌唱音声合成の品質を向上させる方法について検討している.実際の歌唱音声を収録して観察した結果,楽曲のテンポが速くなるにつれ,スペクトルの変動が小さくなる現象があることが明らかとなった.これは,声道の形状が急に変化できないことに起因すると考えられる.既存の歌唱音声合成手法では,このことがあまり考慮されておらず,これが合成音が不自然となる原因の1つとなっている.そこで,本稿では,発声タイミングから推定したスペクトル変動の減少量を表す尺度を用い,線形予測分析により推定された声道断面積関数に対して時間軸に関する平滑化を行うことで,実際の音声を模擬する方法を提案する.これにより,実際の音声のテンポによるスペクトル変動特性の変化を良く近似できることが分かった.

This paper describes a method to improve quality of singing voice synthesis system including consonants. Analysis of recorded signal of real singing voice including consonants indicated that a faster tempo reduces the spectral variance of singing voice, because the vocal tract shape can only change at a limited speed. Since conventional synthesis systems do not take the spectral variance reduction into account, degradation of the synthetic singing voice is caused. We have developed a new measure representing the spectral variance reduction, that is estimated from note-on events of the MIDI signal. Spectral smoothing based on this measure in the domain of the vocal tract area function with respect to time is then applied to the conventional synthesis system. It is found that a generated singing voice by the proposed method successfully simulates the spectral variance reduction of real singing voice.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 74, 45-50, 2008-02-08

    Information Processing Society of Japan (IPSJ)

References:  4

Codes

  • NII Article ID (NAID)
    110006664848
  • NII NACSIS-CAT ID (NCID)
    AN10438388
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09196072
  • NDL Article ID
    9415002
  • NDL Source Classification
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  NDL  NII-ELS 
Page Top