複合ウェーブレットモデルに基づく音声の分析合成 Speech Analysis and Synthesis based on Composite Wavelet Model

この論文をさがす

著者

抄録

本稿では、パラメトリックな音声分析合成モデルとして、複合ウェーブレットモデル(Composite Wavelet Model、以下CWM)法を提案し、その有効性について議論する。従来の巡回型フィルタによる音声合成では、その時間特性が音声品質低下の一要因である可能性があり、提案法ではこれを改善することが期待できる。提案法では音声のスペクトル包絡を混合ガウス関数モデル(GMM)で近似することで少数のパラメータによって表現する。合成時にはこのGMMの逆フーリエ変換である複合Gaborウェーブレットを基本波形として、これをピッチ周期ごとに重ね合わせて有声音を合成する。検証のため、提案法により音声を分析合成し、時間特性が改善されていることを確認した。

In this paper, we propose and discuss Composite Wavelet Model (CWM) for speech analysis and synthesis. Conventional speech synthesis using recursive filter involves a problem of temporal characteristics which may cause degradation of synthetic speech quality. In our new method, speech is analyzed by approximating the spectral envelope with a Gaussian Mixture Model (GMM). In the synthesis stage, the basic waveform is chosen to be composite Gabor function which is inverse Fourier transform of Gaussian mixture and is pitch-synchronously overlapped and added. For preliminary evaluation of the proposed method, we analyzed and synthesized speech and showed that it improved the temporal characteristics.

収録刊行物

  • 電子情報通信学会技術研究報告. SP, 音声

    電子情報通信学会技術研究報告. SP, 音声 105(370), 1-6, 2005-10-27

    一般社団法人電子情報通信学会

参考文献:  14件中 1-14件 を表示

各種コード

  • NII論文ID(NAID)
    110003497449
  • NII書誌ID(NCID)
    AN10013221
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    7703641
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ