行動価値に着目した学習分類子システムの改善:マルチエージェント強化学習への接近

書誌事項

タイトル別名
  • コウドウ カチ ニ チャクモク シタ ガクシュウ ブンルイシ システム ノ カイゼン マルチエージェント キョウカ ガクシュウ エ ノ セッキン
  • Improvement of Learning Classifier System by Action-value Function toward Multi-agent Reinforcement Learning
  • エージェント学習システム

この論文をさがす

抄録

これまでで最も改善された学習分類子システムであるXCS は,決定的状態遷移からなる環境でのみ正しく動作することが知られている.本論文では,決定的状態遷移環境よりも複雑なマルチエージェント環境でも利用できる学習分類子システムを目指し,適切な経験の一般化が可能なXCS-QT を提案する.そしてその優位性をシミュレーション実験により示す.具体的には木の問題および追跡問題を用いて実験し,マルチエージェント環境はXCS にとって正しく動作できないいくつかの要因が含まれていること,およびXCS-QT がそれら要因を克服することを示す.

XCS is the newest Learning Classifier System (LCS), and at present it can only be used for deterministic transition environments. This paper proposes XCS-QT as a modified LCS that can appropriately generalize its experience and can be used for multi-agent environments that are more complex than deterministic transition environments. We then show the system’s advantage via simulation experiments using quasi-tree problems and hunter problems. Through the experiments, we demonstrate that there are several reasons why XCS cannot work very well in multi-agent environments, and that XCS-QT can overcome those problems.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (14)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ