Hidden Markov model-baced estimation of lip motion from audio signals 隠れマルコフモデルに基づいた音声信号からの唇の動きの推定

この論文をさがす

著者

    • 山本, 英里 ヤマモト, エリ

書誌事項

タイトル

Hidden Markov model-baced estimation of lip motion from audio signals

タイトル別名

隠れマルコフモデルに基づいた音声信号からの唇の動きの推定

著者名

山本, 英里

著者別名

ヤマモト, エリ

学位授与大学

奈良先端科学技術大学院大学

取得学位

博士(工学)

学位授与番号

甲第60号

学位授与年月日

1999-03-24

注記・抄録

博士論文

目次

  1. Abstract / p1 (0003.jp2)
  2. Contents / p5 (0005.jp2)
  3. 1 Introduction / p1 (0010.jp2)
  4. 1.1. Introduction / p1 (0010.jp2)
  5. 1.2. Anthropomorphic Computer Agents as a User Interface / p2 (0011.jp2)
  6. 1.3. Visual Speech Synthesis for Anthropomorphic Agents / p4 (0012.jp2)
  7. 1.4. Lip Movement Synthesis from Audio Signals:Focus and Aim of Thesis / p5 (0012.jp2)
  8. 1.5. Proposed Mapping Methods from Audio Parameters to Visual Parameters / p7 (0013.jp2)
  9. 1.6. Structure of Thesis / p11 (0015.jp2)
  10. 2 Foundations / p13 (0016.jp2)
  11. 2.1. Hidden Markov Models / p13 (0016.jp2)
  12. 2.2. Viterbi Alignment as a Speech Recognition Technique / p17 (0018.jp2)
  13. 2.3. Maximum Likelihood Estimation of HMM Model Parameters / p20 (0020.jp2)
  14. 2.4. Summary / p25 (0022.jp2)
  15. 3 Mapping Methods from Audio Parameters to Visual Parameters / p27 (0023.jp2)
  16. 3.1. VQ method / p28 (0024.jp2)
  17. 3.2. HMM-Viterbi method / p30 (0025.jp2)
  18. 3.3. Proposed SV-HMM-Viterbi method / p33 (0026.jp2)
  19. 3.4. HMM-EM Method / p36 (0028.jp2)
  20. 3.5. Summary / p40 (0030.jp2)
  21. 4 Lip Movement Synthesis from Audio Signals / p41 (0030.jp2)
  22. 4.1. Implementation / p41 (0030.jp2)
  23. 4.2. Evaluation / p49 (0034.jp2)
  24. 5 Conclusion and Future Work / p65 (0042.jp2)
  25. 5.1. Contribution / p65 (0042.jp2)
  26. 5.2. Related Works / p67 (0043.jp2)
  27. 5.3. Future Work / p68 (0044.jp2)
  28. Acknowledgements / p72 (0046.jp2)
  29. References / p74 (0047.jp2)
  30. Appendix / p86 (0053.jp2)
  31. A. Linguistic representational units of the audio-visual speech / p86 (0053.jp2)
  32. A.1 Phonetic segment of auditory speech / p86 (0053.jp2)
  33. A.2 Phonetic feature of auditory speech / p86 (0053.jp2)
  34. A.3 Phonetic feature of visual speech / p87 (0053.jp2)
  35. B. Proofs / p89 (0054.jp2)
  36. B.1 Baum's formula maximizing the likelihood in EM algorithm / p89 (0054.jp2)
  37. B.2 Maximizing the auxiliary function equals maximizing the likelihood / p90 (0055.jp2)
  38. C. Derivation of the visual parameter estimation formula in the HMM-EM method / p91 (0055.jp2)
  39. D. Glossary of terms / p94 (0057.jp2)
0アクセス

各種コード

  • NII論文ID(NAID)
    500000174717
  • NII著者ID(NRID)
    • 8000000174994
  • DOI(NDL)
  • NDL書誌ID
    • 000000339031
  • データ提供元
    • NDL-OPAC
    • NDLデジタルコレクション
ページトップへ