音声の高域に含まれる個人性情報を用いた話者認識

書誌事項

タイトル別名
  • Speaker recognition using speaker individual information in the higher frequency band
  • オンセイ ノ コウイキ ニ フクマレル コジンセイ ジョウホウ オ モチイタ

この論文をさがす

抄録

話者認識の分野において、音声の高域の周波数領域に含まれる話者の個人性情報については、従来ほとんど軽視されてきた。本論文では、音声の高域に含まれる話者情報について調査し、話者認識における高域の貢献度について調べる。また、幾つかの環境雑音が音声の高域に与える影響についても検討する。実験の結果、音声の高域には話者の個人性情報が確かに存在すると共に、その情報を用いることにより、話者認識性能を効果的に改善できることが分かった。また、低域の音声パラメータは発声時期によって大きく変動するが、高域は長期間にわたって安定であることが分かった。更に、低域と高域の話者内距離の相関は小さく、音声の高域は低域と冗長性がほとんどなく、低域と高域の両方を話者認識に用いることの有効性を示した。また、道路や計算機室など、エネルギーが低周波数領域に集中するような雑音環境に対して、音声の高域は低域に匹敵する認識性能を示すことが分かった。更に、このような雑音環境下においても音声を広帯域化することにより認識率が改善できることが分かった。

収録刊行物

  • 日本音響学会誌

    日本音響学会誌 51 (11), 861-868, 1995

    一般社団法人 日本音響学会

被引用文献 (16)*注記

もっと見る

参考文献 (14)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ