ランダムタイリングと Gibbs-sampling を用いた多次元状態-行動空間における強化学習 Reinforcement Learning in Multi-dimensional State-action Space Using Random Tiling and Gibbs Sampling

この論文にアクセスする

この論文をさがす

著者

    • 木村 元 KIMURA Hajime
    • 九州大学大学院工学研究院海洋システム工学部門 Dept. of Marine Engineering, Graduate School of Engineering, Kyushu University

抄録

In real-robot applications, learning controllers are often required to obtain control rules over high-dimensional continuous state-action space. Random tile-coding is a promising method to deal with high-dimensional state space for representing the state value function. However, there is no standard reinforcement learning scheme to deal with action selection in high-dimensional action space, especially the probability of action variables are mutually dependent. This paper introduces a new action selection scheme using random tile-coding and Gibbs sampling, and shows the Q-learning algorithm applying the proposed scheme. We demonstrate it through a Rod in maze problem and a redundant arm reaching task.

収録刊行物

  • 計測自動制御学会論文集  

    計測自動制御学会論文集 42(12), 1336-1343, 2006-12-31 

    The Society of Instrument and Control Engineers

参考文献:  12件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  3件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10018422317
  • NII書誌ID(NCID)
    AN00072392
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    04534654
  • NDL 記事登録ID
    8625992
  • NDL 雑誌分類
    ZM11(科学技術--科学技術一般--制御工学)
  • NDL 請求記号
    Z14-482
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ