複合ウェーブレットモデルに基づく音声の分析合成  [in Japanese] Speech Analysis and Synthesis based on Composite Wavelet Model  [in Japanese]

Search this Article

Author(s)

Abstract

本稿では、パラメトリックな音声分析合成モデルとして、複合ウェーブレットモデル(Composite Wavelet Model、以下CWM)法を提案し、その有効性について議論する。従来の巡回型フィルタによる音声合成では、その時間特性が音声品質低下の一要因である可能性があり、提案法ではこれを改善することが期待できる。提案法では音声のスペクトル包絡を混合ガウス関数モデル(GMM)で近似することで少数のパラメータによって表現する。合成時にはこのGMMの逆フーリエ変換である複合Gaborウェーブレットを基本波形として、これをピッチ周期ごとに重ね合わせて有声音を合成する。検証のため、提案法により音声を分析合成し、時間特性が改善されていることを確認した。

In this paper, we propose and discuss Composite Wavelet Model (CWM) for speech analysis and synthesis. Conventional speech synthesis using recursive filter involves a problem of temporal characteristics which may cause degradation of synthetic speech quality. In our new method, speech is analyzed by approximating the spectral envelope with a Gaussian Mixture Model (GMM). In the synthesis stage, the basic waveform is chosen to be composite Gabor function which is inverse Fourier transform of Gaussian mixture and is pitch-synchronously overlapped and added. For preliminary evaluation of the proposed method, we analyzed and synthesized speech and showed that it improved the temporal characteristics.

Journal

  • IEICE technical report

    IEICE technical report 105(370), 1-6, 2005-10-27

    The Institute of Electronics, Information and Communication Engineers

References:  14

Codes

  • NII Article ID (NAID)
    110003497449
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    7703641
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top