HMMを用いた自然な発話動画像合成  [in Japanese] Facial Movement Synthesis by HMM from Audio Speech  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

入力音声から音声と同期した自然で現実感のあるコミュニケーションが可能な顔動画像の合成法を提案している.コンピュータを介した人間のコミュニケーションをより自然な形で実現できれば, コンピュータと人間のコミュニケーションの幅を飛躍的に広げることが可能である.我々は, 以前にいくつかHMMに基づく音声からの唇動画像合成法を提案しており, 特に後続音素の口形素を考慮することにより, 飛躍的に自然さを増すことに成功している.更に本論文では, 前後口形素を考慮した合成法を提案し, 唇画像から顔3次元モデルへの拡張を行った.発話顔形状を生成するために, 顔表面3次元計測点に主成分分析を行い, 主成分に対応した顔形状をあらかじめ作成することにより, 自然で滑らかな発話顔形状の合成を実現する.本手法により生成した発話動画像について, パラメータ生成誤差による評価と主観評価の結果, 本手法により入力音声に対応した自然で滑らかな発話動画像が合成可能であることを確認した.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00011), 2498-2506, 2000-11-25

    The Institute of Electronics, Information and Communication Engineers

References:  14

Cited by:  4

Codes

  • NII Article ID (NAID)
    110003183862
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5643761
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IR 
Page Top