韻律的に多重化した音声データベースの設計と発話速度におけるその評価

Bibliographic Information

Other Title
  • インリツテキ ニ タジュウカ シタ オンセイ データベース ノ セッケイ ト ハツワ ソクド ニ オケル ソノ ヒョウカ
  • Speech Databases with Various Prosody and Its Evaluation on Speech Rate

Search this article

Abstract

本論文では,多様な発話速度制御が可能で高品質な音声合成手法の検討を行う.波形素行接続方式では,PSOLA法や分析合成手法を用いて韻律の変更を行う場合,変更の程度に応じて品質劣化が生じる.そこで,発話速度ごとの音声データベースを用いることにより,音素持続時間の変更量を削減し品質劣化を低減する手法を提案する.本手法の特徴は, (1)目標とする発話速度の合成音声を発声ごとに呈示して音声を収録すること,(2)発話速度の異なる同一のテキストの音声データベースを作成すること,である.本手法では,速い・普通・遅いの3種類の発話速度の音声データベースを収録した.本手法で収録した音声データベース及び従来法(標準的な発話速度の音声データベース)を用いて,2種類(速い・遅い)の発話速度の音声を合成し,聴取実験を行った結果,本手法は従来法と比較してより高品質な音声が合成可能であることが分かった.また,発話速度の異なる音声データベースを統合して使用した場合,データベース間の声質の速いの影響により音質が劣化する可能性があるが,聴取実験を行って調査した結果,声質による影響は許容範囲にあると考えられる.

Journal

Citations (4)*help

See more

References(17)*help

See more

Related Projects

See more

Keywords

Details 詳細情報について

Report a problem

Back to top