個人差を考慮した連続音声認識に関する研究

この論文をさがす

著者

    • 小坂, 哲夫 コサカ, テツオ

書誌事項

タイトル

個人差を考慮した連続音声認識に関する研究

著者名

小坂, 哲夫

著者別名

コサカ, テツオ

学位授与大学

東北大学

取得学位

博士 (情報科学)

学位授与番号

乙第7236号

学位授与年月日

1997-04-10

注記・抄録

博士論文

論文

目次

  1. 目次 / p1 (0003.jp2)
  2. 1 序論 / p1 (0005.jp2)
  3. 1.1 研究の背景と目的 / p1 (0005.jp2)
  4. 1.2 不特定話者音声認識研究の現状 / p2 (0006.jp2)
  5. 1.3 従来の研究の問題点と本研究の目標 / p13 (0011.jp2)
  6. 1.4 本論文の構成 / p21 (0015.jp2)
  7. 2 不特定話者音声認識用混合連続分布HMMの精度向上の検討 / p23 (0016.jp2)
  8. 2.1 まえがき / p23 (0016.jp2)
  9. 2.2 隠れマルコフモデル(HMM) / p23 (0016.jp2)
  10. 2.3 混合連続分布HMMの構造について / p25 (0017.jp2)
  11. 2.4 混合数の増加における問題点 / p27 (0018.jp2)
  12. 2.5 混合数の自動決定アルゴリズム / p33 (0021.jp2)
  13. 2.6 音声特徴の抽出 / p36 (0023.jp2)
  14. 2.7 混合数自動決定の評価実験 / p39 (0024.jp2)
  15. 2.8 まとめ / p42 (0026.jp2)
  16. 3 話者混合法による不特定話者音声認識および話者適応 / p45 (0027.jp2)
  17. 3.1 まえがき / p45 (0027.jp2)
  18. 3.2 話者混合逐次状態分割法 / p46 (0028.jp2)
  19. 3.3 逐次状態分割法(SSS)によるHMnetの生成 / p47 (0028.jp2)
  20. 3.4 話者混合逐次状態分割法のアルゴリズム / p49 (0029.jp2)
  21. 3.5 話者混合逐次状態分割法による不特定話者音声認識実験 / p54 (0032.jp2)
  22. 3.6 話者クラスタリング手法の導入 / p60 (0035.jp2)
  23. 3.7 モデル合成法による不特定話者モデルの作成(CCL) / p62 (0036.jp2)
  24. 3.8 CCLを用いた認識実験 / p66 (0038.jp2)
  25. 3.9 話者重み学習 / p73 (0041.jp2)
  26. 3.10 話者プルーニング / p74 (0042.jp2)
  27. 3.11 話者重み学習および話者プルーニングの認識実験による検討 / p76 (0043.jp2)
  28. 3.12 適応データ量に応じた話者適応 / p79 (0044.jp2)
  29. 3.13 動的話者適応を用いた適応実験 / p84 (0047.jp2)
  30. 3.14 まとめ / p88 (0049.jp2)
  31. 4 木構造話者クラスタリングによる話者適応 / p91 (0050.jp2)
  32. 4.1 まえがき / p91 (0050.jp2)
  33. 4.2 話者適応の原理 / p93 (0051.jp2)
  34. 4.3 アルゴリズム / p94 (0052.jp2)
  35. 4.4 認識実験 / p101 (0055.jp2)
  36. 4.5 まとめ / p108 (0059.jp2)
  37. 5 教師なし話者適応を利用した不特定話者音声認識 / p111 (0060.jp2)
  38. 5.1 まえがき / p111 (0060.jp2)
  39. 5.2 木構造話者クラスタリングによる不特定話者音声認識の原理 / p112 (0061.jp2)
  40. 5.3 認識実験 / p113 (0061.jp2)
  41. 5.4 まとめ / p120 (0065.jp2)
  42. 6 結論 / p123 (0066.jp2)
  43. 謝辞 / p127 (0068.jp2)
  44. 参考文献 / p129 (0069.jp2)
  45. 発表文献 / p141 (0075.jp2)
  46. A 音声データベース / p149 (0079.jp2)
  47. A.1 セットA(大語彙単語音声および文節・文章音声) / p149 (0079.jp2)
  48. A.2 セットC(多数話者) / p150 (0080.jp2)
0アクセス

各種コード

  • NII論文ID(NAID)
    500000153953
  • NII著者ID(NRID)
    • 8000001092965
  • DOI(NDL)
  • 本文言語コード
    • jpn
  • NDL書誌ID
    • 000000318267
  • データ提供元
    • 機関リポジトリ
    • NDL-OPAC
    • NDLデジタルコレクション
ページトップへ