隠れマルコフモデルを用いた視覚音声認識のための正規化学習

南角, 吉彦, 徳田, 恵一, 北村, 正, 小林, 隆夫

Bibliographic Information

Other Title

カクレ　マルコフ　モデル　オモチイタ　シカク　オンセイ　ニンシキ　ノタメノ　セイキカ　ガクシュウ
Normalized Training for HMM-Based Visual Speech Recognition

Search this article

Abstract

本論文では，視覚音声認識のための連続密度HMM（Hidden Markov Model）のパラメータ推定法について述べる．これまでの視覚音声認識の研究は，大きく画像ベース法とモデルベース法の二つに分類することができる．画像ベース法は，原画像の画素値にサブサンプリングや主成分分析などの何らかの前処理を施したものを特徴ベクトルとして用いる手法である．しかし，唇の位置や大きさ，照明条件などが認識率に直接的な影響を及ぼすため，これらの正規化が重要な要素技術となる．従来の正規化手法は，HMMとは独立に何らかの基準を設け，学習の前に正規化を行うのが一般的であった．本論文では，ML（Maximum Likelihood）基準による正規化を考え，唇の位置，大きさ，傾き，平均輝度，コントラストなどの正規化プロセスがモデルの学習と統合された正規化学習法を提案する．提案法は，EM（Expectation Maximization）アルゴリズムに基づいて定式化されており，正規化学習の繰返しにより学習データに関するゆう度が単調に増加することが保証されている．また，M2VTSデータベースを用いた単語認識実験により提案法の有効性を示す．

Journal

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理

電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 J86-D2 (2), 163-172, 2003-02-01

Institute of Electronics, Information and Communication Engineers

Details 詳細情報について

CRID: 1050845762422539776

NII Article ID: 110003170875

NII Book ID: AA11340957

ISSN: 09151923

NDL BIB ID: 6452447

Web Site: http://id.nii.ac.jp/1476/00005113/; https://ndlsearch.ndl.go.jp/books/R000000004-I6452447

Text Lang: ja

Article Type: journal article

Data Source

IRDB
NDL
CiNii Articles

Export

隠れマルコフモデルを用いた視覚音声認識のための正規化学習

Bibliographic Information

Search this article

Abstract

Journal

Citations (8)*help

References(19)*help

Keywords

Details 詳細情報について

Export

Report a problem

隠れマルコフモデルを用いた視覚音声認識のための正規化学習

Bibliographic Information

Search this article

Abstract

Journal

Citations (8)*help

References(19)*help

Keywords

Details 詳細情報について

Export

Report a problem

Project list