ATR音声データベース内の文音声における知覚的話者間類似度の計測

DOI Web Site オープンアクセス

書誌事項

タイトル別名
  • Measurement of perceptual speaker similarity for sentence speech in ATR speech database
  • ATR オンセイ データベース ナイ ノ ブン オンセイ ニ オケル チカクテキワシャ カン ルイジド ノ ケイソク

この論文をさがす

抄録

ATR音声データベースセットCの関東出身話者男女各20名による文音声を対象にして音声の個人性の類似度評価を行った。同性の2話者の音声を1対とし,話者すべての組み合わせを実験参加者に提示してその類似度を5段階で判定させた。その後,異なる実験参加者群により再度同じ実験を行い,結果の再現性を確認した。その結果から知覚的な話者間類似度を求めると共に非計量多次元尺度構成法にて話者を平面上に布置した。得られた話者の布置と相関の高い特徴量を求めたところ,男性話者では平均F_0と話者の年齢とポーズ合計時間長,女性話者では平均F_0と発話時間長と話者の年齢となった。

収録刊行物

  • 日本音響学会誌

    日本音響学会誌 71 (10), 516-525, 2015

    一般社団法人 日本音響学会

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ