STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法  [in Japanese] Maximum Likelihood Voice Conversion Based on Gaussian Mixture Model with STRAIGHT Mixed Excitation  [in Japanese]

Search this Article

Author(s)

    • 大谷 大和 OHTANI Yamato
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
    • 戸田 智基 TODA Tomoki
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
    • 鹿野 清宏 SHIKANO Kiyohiro
    • 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology

Abstract

声質変換において,スペクトル特徴量系列の統計的モデル化技術の発展により,その変換性能は大幅に改善された.しかし,声質変換で用いられる音源モデルでは実際の音源を正確に表現できていないため,その変換音声の自然性は十分なものとはいいがたい.これを改善するために,スペクトル特徴量系列と同様に音源特徴量系列に対しても統計的なモデリングを行う必要がある.本論文では混合正規分布モデル(Gaussian Mixture Model: GMM)に基づく声質変換法の枠組みに対してSTRAIGHT混合励振源を導入する.提案法では,スペクトル特徴量系列及び音源特徴量系列に対して最ゆう推定(Maximum likelihood estimation: MLE)に基づく特徴量変換が行われる.客観評価実験並びに主観評価実験の結果より,提案法により音質,話者性変換精度が大きく改善されることを示す.

Journal

  • The IEICE transactions on information and systems

    The IEICE transactions on information and systems 91(4), 1082-1091, 2008-04-01

    The Institute of Electronics, Information and Communication Engineers

References:  15

Cited by:  3

Codes

  • NII Article ID (NAID)
    110007381053
  • NII NACSIS-CAT ID (NCID)
    AA12099634
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    18804535
  • NDL Article ID
    9454793
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-779
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top