KL変換に基づく音声特徴抽出の検討

書誌事項

タイトル別名
  • Study on Speech Feature Extraction based on KLT

この論文をさがす

抄録

HMMを用いた音声認識システムでは、音声特徴量としてスペクトラムやケプストラム等の静的な特徴量が広く用いられている。この静的特徴量は、スペクトル包絡に音韻性があると考える音声認識の根底をなすものである。しかしこれまで、スペクトル包絡の情報のみを特徴量とし、スペクトラムの時間的な遷移の表現を全てHMMに委ねるアプロ-チには、自ずと限界がある事が指摘され続けてきた。そのため、静的特徴量だけでなく、その特徴量の時間的変化を直接表現しようとする動的特徴量が広く用いられているが、静的特徴量と動的特徴量の様々な組合せがもつ長所と短所については、十分に議論されてきたとは言い難い。本報告では、スペクトル領域でのデルタ拡張とKL変換による新しい音声特徴抽出を提案するとともに、音声特徴量を動的特徴量の視点から再検討し、それらの特徴量を、音素認識と大語彙連続音声認識における認識性能で比較することで、提案手法の有効性を実験的に示した。

収録刊行物

参考文献 (7)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570854177363438464
  • NII論文ID
    110003296862
  • NII書誌ID
    AN10013221
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ