隠れマルコフモデルを用いた視覚音声認識のための正規化学習

Bibliographic Information

Other Title
  • カクレ マルコフ モデル オモチイタ シカク オンセイ ニンシキ ノタメノ セイキカ ガクシュウ
  • Normalized Training for HMM-Based Visual Speech Recognition

Search this article

Abstract

本論文では,視覚音声認識のための連続密度HMM(Hidden Markov Model)のパラメータ推定法について述べる.これまでの視覚音声認識の研究は,大きく画像ベース法とモデルベース法の二つに分類することができる.画像ベース法は,原画像の画素値にサブサンプリングや主成分分析などの何らかの前処理を施したものを特徴ベクトルとして用いる手法である.しかし,唇の位置や大きさ,照明条件などが認識率に直接的な影響を及ぼすため,これらの正規化が重要な要素技術となる.従来の正規化手法は,HMMとは独立に何らかの基準を設け,学習の前に正規化を行うのが一般的であった.本論文では,ML(Maximum Likelihood)基準による正規化を考え,唇の位置,大きさ,傾き,平均輝度,コントラストなどの正規化プロセスがモデルの学習と統合された正規化学習法を提案する.提案法は,EM(Expectation Maximization)アルゴリズムに基づいて定式化されており,正規化学習の繰返しにより学習データに関するゆう度が単調に増加することが保証されている.また,M2VTSデータベースを用いた単語認識実験により提案法の有効性を示す.

Journal

Citations (8)*help

See more

References(19)*help

See more

Details 詳細情報について

Report a problem

Back to top