波形素片接続型音声合成システムの検討

書誌事項

タイトル別名
  • A Study of a Text-to-Speech System based on Waveform Splicing

この論文をさがす

抄録

波形編集方式にもとづく音声合成システムに関する検討を行い、実験システムを構築した。波形素片の蓄積単位は、スペクトルの不連続性の大きい音素境界で分割した音素連鎖であり、音節程度の長さである。不適切な音素環境から抽出された波形素片を接続することによって生じる音質劣化を低減するため、2種類の先行環境と5種類の後続環境を区別する。約2000万文字のテキストデータを対象とした蓄積単位の調査結果にもとづいて、出現率の高い1986個の蓄積単位を含む波形素片データセットを作成した。有声の波形素片には、開始・ピーク・終了の3種類のピッチマークを付与する。基本周波数および持続時間の変更はPSOLA(pihtch synch ronous overlap add)法によって行う。ピッチ素片の切り出し窓は、音声のように窓の範囲内で一様とはみなせない信号にPSOLA法を適用することによって生じる音質劣化を低減するために、中央に平坦部分をもつ形状とした。

収録刊行物

  • 信学技報

    信学技報 93 49-54, 1993

    一般社団法人電子情報通信学会

被引用文献 (12)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571980077270828672
  • NII論文ID
    110003296674
  • NII書誌ID
    AN00245490
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ