POMDPsへの行動優先度学習型強化学習アルゴリズムの適用

書誌事項

タイトル別名
  • POMDPs エ ノ コウドウ ユウセンド ガクシュウガタ キョウカ ガクシュウ アルゴリズム ノ テキヨウ

この論文をさがす

抄録

本論文では,不完全知覚環境(POMDPs)にprofit sharingの類であるOnPS,FVPS,LVPSを適用する.これまでに良い結果が報告されているSarsa(0.9)とも比較し,OnPSが最も優れていることを確認した.

収録刊行物

被引用文献 (2)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ