トラジェクトリ特徴量に基づく単語読唇  [in Japanese] Lip Reading Based on Trajectory Feature  [in Japanese]

Search this Article

Author(s)

Abstract

本論文では視覚情報を利用して人間の発話内容を理解する,いわゆる読唇において高認識率が得られるトラジェクトリ特徴量を提案する.トラジェクトリ特徴量は,口唇領域または口内領域より計測できる面積とアスペクト比の二つの特徴量をもとに,発話により生じる2特徴量の時間的変化を口形の軌道として表現される.認識はトラジェクトリ特徴量に二次元DPマッチングを適用する.(1)車椅子制御用10単語と(2)数字10単語の動画像において,これまで提案されている特徴量とトラジェクトリ特徴量の比較実験を行った結果,従来特徴量で最も高い認識率は(1)92.5%,(2)72.0%であったのに対し,トラジェクトリ特徴量は(1)99.5%,(2)83.5%の高認識率を得た.また処理速度,発話速度を考慮して擬似的にフレームレートを変更して比較実験を行った結果,従来の特徴量で最も高い認識率は69.5%であるのに対し,トラジェクトリ特徴量では98.0%と高い認識率であった.これより,トラジェクトリ特徴量は発話速度に対してロバストであり,かつ高い認識精度を有することを確認した.

Journal

  • The IEICE transactions on information and systems

    The IEICE transactions on information and systems 90(4), 1105-1114, 2007-04-01

    The Institute of Electronics, Information and Communication Engineers

References:  24

Cited by:  42

Codes

  • NII Article ID (NAID)
    110007380704
  • NII NACSIS-CAT ID (NCID)
    AA12099634
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    18804535
  • NDL Article ID
    8773646
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-779
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top