HMMに基づく音声合成のための状態継続長モデルの構築

書誌事項

タイトル別名
  • State Duration Modeling for HMM-Based Speech Synthesis

この論文をさがす

抄録

本論文では, HMMに基づく音声合成のための状態継続長モデルの構築法について述べる.音素HMMの各状態の状態継続長は1次元のガウス分布でモデル化し, 一つの音素HMMの全状態の状態継続長分布をまとめて一つの多次元のガウス分布として状態継続長モデルとする.状態継続長モデルは, 状態継続長に影響を与える要因を考慮して, 決定木によるコンテキストクラスタリングによりクラスタリングする.音声合成時には, 状態継続長モデルから尤度最大化基準により状態継続長を決定し, それに従いHMMからスペクトル列を生成する.予備実験において先行・当該・後続音素のみを考慮した状態継続長モデルでも, 自然のタイミングに近い合成音声を得ることができることを既に確認している.本論文では, さらにアクセント型, 構文情報のような状態継続長に影響を与える他の変動要因も考慮した実験を行った.

収録刊行物

被引用文献 (7)*注記

もっと見る

参考文献 (15)*注記

もっと見る

詳細情報

  • CRID
    1572543027323361664
  • NII論文ID
    110003279923
  • NII書誌ID
    AN10060786
  • ISSN
    09135685
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ