強化学習における感覚系と行動系の同時学習

この論文をさがす

著者

    • 鮫島, 和行 サメジマ, カズユキ

書誌事項

タイトル

強化学習における感覚系と行動系の同時学習

著者名

鮫島, 和行

著者別名

サメジマ, カズユキ

学位授与大学

東京農工大学

取得学位

博士(工学)

学位授与番号

甲第225号

学位授与年月日

1999-03-25

注記・抄録

博士論文

目次

  1. Abstract / (0006.jp2)
  2. 目次 / p1 (0007.jp2)
  3. 1 Introduction / p1 (0010.jp2)
  4. 2 背景 / p3 (0012.jp2)
  5. 2.1 強化学習 / p4 (0013.jp2)
  6. 2.2 強化学習の実世界での問題(観測空間分割問題) / p7 (0016.jp2)
  7. 3 報酬による感覚系の学習 / p13 (0022.jp2)
  8. 3.1 Actor-Criticの感覚系への拡張 / p14 (0023.jp2)
  9. 3.2 適応的基底関数分割アルゴリズム(Adaptive Basis function Division(ABD)algorithm) / p15 (0024.jp2)
  10. 3.3 ベンチマーク課題によるABDアルゴリズムの動作検証 / p18 (0027.jp2)
  11. 4 衝突回避問題への適用と従来アルゴリズムとの比較 / p25 (0034.jp2)
  12. 4.1 衝突回避問題による検証 / p26 (0035.jp2)
  13. 4.2 従来アルゴリズムとの比較 / p27 (0036.jp2)
  14. 4.3 ABDアルゴリズムとABA、ABA+AIVアルゴリズムの比較 / p35 (0044.jp2)
  15. 4.4 本章のまとめ / p38 (0047.jp2)
  16. 5 実世界移動ロボットにおける検証 / p39 (0048.jp2)
  17. 5.1 実世界移動ロボットデータベースにおける学習 / p40 (0049.jp2)
  18. 5.2 学習された行動戦略の実機による評価 / p44 (0053.jp2)
  19. 5.3 考察 / p46 (0055.jp2)
  20. 5.4 連続的パラメータ調整 / p47 (0056.jp2)
  21. 5.5 本章のまとめ / p49 (0058.jp2)
  22. 6 階層化による定型行動パターンの自己組織化と行動空間の離散化 / p52 (0061.jp2)
  23. 6.1 マクロ状態による観測の簡素化 / p54 (0063.jp2)
  24. 6.2 マクロ状態内での専用制御器の学習 / p56 (0065.jp2)
  25. 6.3 マクロ状態間の遷移予測による自動的行動の獲得 / p60 (0069.jp2)
  26. 6.4 local macro controlerによる新規環境への適応能力 / p65 (0074.jp2)
  27. 6.5 本章のまとめ / p67 (0076.jp2)
  28. 7 まとめ / p71 (0080.jp2)
  29. 参考文献 / p74 (0083.jp2)
5アクセス

各種コード

  • NII論文ID(NAID)
    500000174882
  • NII著者ID(NRID)
    • 8000000175159
  • DOI(NDL)
  • NDL書誌ID
    • 000000339196
  • データ提供元
    • NDL-OPAC
    • NDLデジタルコレクション
ページトップへ