表現力豊かな合成音声を生成するための記述言語MSCLの構想

書誌事項

タイトル別名
  • MSCL : Control Language for Expressive Synthetic Speech Variations

この論文をさがす

抄録

多種多様な感情を含み表現力豊かな合成音声メディアの作成・編集を可能にする階層型合成音声制御記述言語MSCL(Multi-layered Speech/Sound Synthesis Control Language)を提案[1]している. MSCLは, 音声合成に関する知識を持たないユーザであっても容易に対話口調, あるいは, 多種多様の感情を含んだ合成音声を作成できる記述言語である. また, 合成音声との同期が必要な場合は, きめ細かな時間長制御も可能にする. MSCLは3つの階層構造を持っており, "賛同"や"嘆き"といった意味的な記述レベルであるS層, 音韻特徴の記述レベルである I層, そして, 音韻毎のピッチやパワーなどのより詳細な韻律制御パラメタを持つP層に分れている。本報告では, I層のためのピッチパターンに関する幾つかの基本的な韻律制御方法を合成音声を用いて検討した. また, 各韻律制御方法および制御方法の組み合わせによる聴覚的な効果を聴取評価実験によって明らかにした. この結果, ピッチパターンの制御によって多彩な感情を表現できることが分った. 制御方法の組み合わせによって表現できる感情を制御コマンドとし, S層への導入を検討した.

収録刊行物

被引用文献 (3)*注記

もっと見る

参考文献 (13)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573387452005558912
  • NII論文ID
    110002916827
  • NII書誌ID
    AN10442647
  • ISSN
    09196072
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ