HMMに基づく音声合成システムにおけるMAP-VFSな用いた声質変換  [in Japanese] Voice Characteristics Conversion for HMM-Based Speech Synthesis System Using MAP-VFS  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 益子 貴史 MASUKO Takashi
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Techology
    • 田村 正統 TAMURA Masatsune
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Techology
    • 小林 隆夫 KOBAYASHI Takao
    • 東京工業大学大学院総合理工学研究科 Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Techology

Abstract

隠れマルコフモデル(HMM)に基づく音声合成システムにおける合成音声の声質変換手法を提案する.提案システムでは合成の基本単位として音素HMMを用いているため,HMMのパラメータを適切に変換すれば合成音声の声質を変換することができると考えられる.そこで本論文では,音声認識の分野で研究されている HMMの話者適応手法を適用することにより,合成音声の声質を少量の学習データを用いて目標話者の声質に変換する手法について検討する.話者適応手法として最大事後確率(MAP)推定法と移動ベクトル場平滑化(VFS)法を組み合わせたMAP-VFS法を適用し,不特定話者モデルから目標話者への適応を行った適応モデルを用いて音声を合成した.主観評価実験により,合成音声の声質について,目標話者による十分なデータで学習した特定話者モデルとの比較を行った.その結果,数文章程度で適応した適応モデルから合成した音声の声質は特定話者モデルを用いた場合と同等となり,合成音声の声質を容易に目標話者の声質に変換できることが示された.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00012), 2509-2516, 2000-12-25

    Institute of Electronics, Information and Communication Engineers

References:  25

Cited by:  9

Codes

  • NII Article ID (NAID)
    110003183863
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5616710
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IR 
Page Top