HMM 音声合成におけるコンテキストクラスタリング決定木を用いた話者適応の検討  [in Japanese] Speaker adaptation using context clustering decision tree for HMM-based speech synthesis  [in Japanese]

Search this Article

Author(s)

    • 山岸 順一 YAMAGISHI Junichi
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
    • 益子 貴史 MASUKO Takashi
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology
    • 小林 隆夫 KOBAYASHI Takao
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology

Abstract

任意の個人性や感情表現を持つ音声を合成するためには音声のフレーム単位の特徴だけではなく,複数のフレームに渡って現れるセグメント単位の特徴も考慮する必要がある.本論文では,HMM音声合成においてセグメント単位の特徴も反映した最尤線形回帰(MLLR)に基づく話者適応を実現するため,学習時に構築されたコンテキストクラスタリング決定木を回帰行列の共有に利用する手法を提案する.コンテキストクラスタリング決定木を構築する際の質問には位置や長さなどのセグメント単位の特徴に関する質問も合まれているため,決定木に基づいて回帰行列を共有することにより,話者適応後の合成音声にセグメント単位の特徴を反映させることができると考えられる.提案手法により,従来の分布間の距離に基づく回帰行列の共有手法では困難であったセグメント単位の音韻・韻律特徴の反映が可能であることを示す.

In order to synthesize speech with arbitrary individualities and/or emotional expressions, segment-based features have to be used as well as frame-based features. In this paper, to realize MLLR (Maximum Likelihood Liner Regression) based speaker adaptation reflecting those segment-based features for HMM-based speech synthesis, we propose a technique for applying context clustering decision trees constructed in a training stage to tying of regression matrices. Since a set of questions used for constructing context clustering decision trees contains questions related to segment-based features such as position and length, it is possible to incorporate segment-based features into the adaptation. We show that synthesized speech from the adapted model using the proposed technique can have segment-based features.

Journal

  • IEICE technical report. Speech

    IEICE technical report. Speech 103(264), 31-36, 2003-08-22

    The Institute of Electronics, Information and Communication Engineers

References:  13

Cited by:  1

Codes

  • NII Article ID (NAID)
    110003295695
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09135685
  • NDL Article ID
    6706232
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top