HMMに基づく音声合成システムにおけるMAP-VFSを用いた声質変換

書誌事項

タイトル別名
  • HMM ニ モトヅク オンセイ ゴウセイ システム ニ オケル MAP VFS オ モチイタ セイシツ ヘンカン
  • HMM ニモトズク オンセイ ゴウセイ システム ニオケル MAP-VFS オモチイタ セイシツ ヘンカン
  • Voice Characteristics Conversion for HMM-Based Speech Synthesis System Using MAP-VFS

この論文をさがす

抄録

隠れマルコフモデル(HMM)に基づく音声合成システムにおける合成音声の声質変換手法を提案する.提案システムでは合成の基本単位として音素HMMを用いているため,HMMのパラメータを適切に変換すれば合成音声の声質を変換することができると考えられる.そこで本論文では,音声認識の分野で研究されている HMMの話者適応手法を適用することにより,合成音声の声質を少量の学習データを用いて目標話者の声質に変換する手法について検討する.話者適応手法として最大事後確率(MAP)推定法と移動ベクトル場平滑化(VFS)法を組み合わせたMAP-VFS法を適用し,不特定話者モデルから目標話者への適応を行った適応モデルを用いて音声を合成した.主観評価実験により,合成音声の声質について,目標話者による十分なデータで学習した特定話者モデルとの比較を行った.その結果,数文章程度で適応した適応モデルから合成した音声の声質は特定話者モデルを用いた場合と同等となり,合成音声の声質を容易に目標話者の声質に変換できることが示された.

収録刊行物

被引用文献 (7)*注記

もっと見る

参考文献 (25)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ