素片接続型日本語テキスト音声合成における音素単位とダイフォン単位に基づく素片選択

書誌事項

タイトル別名
  • ソヘン セツゾクガタ ニホンゴ テキスト オンセイ ゴウセイ ニ オケル オンソ タンイ ト ダイフォン タンイ ニ モトヅク ソヘン センタク
  • A Segment Selection Algorithm for Japanese Concatenative Speech Synthesis Based on Both Phoneme Unit and diphone Unit

この論文をさがす

抄録

application/pdf

本論文では,日本語テキスト音声合成(TTS: Text-To-Speech)における新たな素片選択法を提案する.日本語では,母音の無声化を除くとCV(C: 子音,V: 母音)とVから音節が構成されるため,合成単位としてCV単位がよく用いられる.しかし,波形接続型のTTSにおいてCV単位を用いて音声を合成すると,VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV*単位や可変長単位)がこれまでに提案されているが,V-V接続の問題はまだ解決されていない.そこで,V-V接続により生じる不連続感を低減する手法として,音素単位とダイフォン単位に基づいた新たな素片選択法を提案する.提案法では,音素境界における接続だけでなく,母音中心における接続も考慮して素片選択が行われる.評価実験結果から,提案法は音素単位に基づいた従来法と比較し,より自然性の高い音声を合成できることが明らかになった.

収録刊行物

被引用文献 (15)*注記

もっと見る

参考文献 (17)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ