音韻構造を考慮したHMM手話認識における音韻ストリーム重みの最適化手法の検討 A study on stream-weight optimization method for HMM-based sign language recognition using phonemic structure

この論文をさがす

著者

    • 酒向 慎司 SAKO Shinji
    • 名古屋工業大学大学院工学研究科情報工学専攻 Department of Computer Science and Engineering Graduate School of Engineering, Nagoya Institute of Technology
    • 北村 正 KITAMURA Tadashi
    • 名古屋工業大学大学院工学研究科情報工学専攻 Department of Computer Science and Engineering Graduate School of Engineering, Nagoya Institute of Technology

抄録

手話認識の分野では,隠れマルコフモデル(hidden Markov model; HMM)に基づいた手法がいくつか提案されている.我々は,手話の構成素(サブユニット)を様々な手話映像から自動分類し,それらの組合せから単語モデルを構成する手法を提案してきた.これまでの研究では,サブユニットの生成過程に手話の音韻構造を考慮することで,学習の効率化や認識率の改善が示されているが,音韻の重要度に相当する各ストリームの重みをモデル全体で一定値に定めていた.最適なストリーム重みを網羅的に調べ,事前に付与することは,実用的な観点からすると現実的ではない.本報告では,未知データに対しても頑健に働くような適切なストリーム重みを,学習データに基づいて推定する手法を検討し,手話単語の認識タスクにおける評価実験について報告する.

We work on automatic Japanese sign Language (JSL) recognition using hidden Markov models (HMMs). An important issue for modeling sign is that how to determine the constituent element of sign (i.e., subunit) like "phoneme" in spoken language. We focused on special feature of sign language that JSL is composed of three types of phonological elements which is hand local information, position, and movement. In this report, we propose a method for estimate the stream weight of multi-stream HMM which is correspond to phonological elements. An isolated words recognition experiment has confirmed the effectiveness of our proposed method.

収録刊行物

  • 電子情報通信学会技術研究報告. WIT, 福祉情報工学

    電子情報通信学会技術研究報告. WIT, 福祉情報工学 111(174), 25-30, 2011-07-28

    一般社団法人電子情報通信学会

参考文献:  16件中 1-16件 を表示

各種コード

  • NII論文ID(NAID)
    110008801034
  • NII書誌ID(NCID)
    AA1155230X
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    2185-9329
  • NDL 記事登録ID
    11239315
  • NDL 請求記号
    YH247-1099
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ