複数の状態行動価値表を用いたR学習の高速化

  • 石川 浩一郎
    北陸先端科学技術大学院大学 知識科学研究科
  • 櫻井 彰人
    慶應義塾大学 理工学部 管理工学科
  • 藤波 努
    北陸先端科学技術大学院大学 知識科学研究科
  • 國藤 進
    北陸先端科学技術大学院大学 知識科学研究科

書誌事項

タイトル別名
  • R-learning with Multiple State-action Value Tables
  • フクスウ ノ ジョウタイ コウドウ カチヒョウ オ モチイタ R ガクシュウ ノ コウソクカ

この論文をさがす

抄録

We propose a method to improve the performance of R-learning, a reinforcement learning algorithm, by using multiple state-action value tables. Unlike Q- or Sarsa learning, R-learning learns a policy to maximize undiscounted rewards. Multiple state-action value tables cause substantial explorations as needed and make R-learnings to work well. Efficiency of the proposed method is verified through experiments in simulation environment.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (13)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ