音声認識のための高速最ゆう推定を用いた声道長正規化
書誌事項
- タイトル別名
-
- Vocal Tract Length Normalization using Rapid Maximum-Likelihood Estimation for Speech Recognition
この論文をさがす
抄録
近年、隠れマルコフモデル(HMM)を用いた大語業音声認識システムにおいて、声道長パラメータを用いた話者正規化の手法が提案されている。本稿では、声道長による特徴量の変化を、ケプストラム空間における声道長パラメータを用いた線形写像で表現し、そのパラメータを発声から最ゆう推定する手法を提案する。従来の、複数の声道長パラメータを予め用意する手法に比べ、計算量が少なく、より話者に最適なパラメータが推定可能、などの利点がある。日本語5000単語認識を用いた評価実験において、本方式単独で、7.1%誤りが減少し、また、ケプストラム平均正規化(CMN)と組み合わせた場合に、14.6%誤りが減少した。
収録刊行物
-
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
-
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 99 (523), 49-54, 1999-12-20
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1571135652440059520
-
- NII論文ID
- 110003278517
-
- NII書誌ID
- AN10091225
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles