行動価値に着目した学習分類子システムの改善：マルチエージェント強化学習への接近

井上, 寛康, 高玉, 圭樹, 下原, 勝憲

書誌事項

タイトル別名

コウドウカチニチャクモクシタガクシュウブンルイシシステムノカイゼンマルチエージェントキョウカガクシュウエノセッキン
Improvement of Learning Classifier System by Action-value Function toward Multi-agent Reinforcement Learning
エージェント学習システム

この論文をさがす

抄録

これまでで最も改善された学習分類子システムであるXCS は，決定的状態遷移からなる環境でのみ正しく動作することが知られている．本論文では，決定的状態遷移環境よりも複雑なマルチエージェント環境でも利用できる学習分類子システムを目指し，適切な経験の一般化が可能なXCS-QT を提案する．そしてその優位性をシミュレーション実験により示す．具体的には木の問題および追跡問題を用いて実験し，マルチエージェント環境はXCS にとって正しく動作できないいくつかの要因が含まれていること，およびXCS-QT がそれら要因を克服することを示す．

XCS is the newest Learning Classifier System (LCS), and at present it can only be used for deterministic transition environments. This paper proposes XCS-QT as a modified LCS that can appropriately generalize its experience and can be used for multi-agent environments that are more complex than deterministic transition environments. We then show the system’s advantage via simulation experiments using quasi-tree problems and hunter problems. Through the experiments, we demonstrate that there are several reasons why XCS cannot work very well in multi-agent environments, and that XCS-QT can overcome those problems.

収録刊行物

情報処理学会論文誌

情報処理学会論文誌 47 (5), 1483-1492, 2006-05-15

東京 : 情報処理学会

詳細情報詳細情報について

CRID: 1050564287835974144

NII論文ID: 110004720711

NII書誌ID: AN00116647

ISSN: 18827764; 03875806

NDL書誌ID: 7957270

Web Site: http://id.nii.ac.jp/1001/00010300/; https://ndlsearch.ndl.go.jp/books/R000000004-I7957270

本文言語コード: ja

資料種別: journal article

データソース種別

IRDB
NDL
CiNii Articles
KAKEN

行動価値に着目した学習分類子システムの改善：マルチエージェント強化学習への接近

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (14)*注記

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

行動価値に着目した学習分類子システムの改善：マルチエージェント強化学習への接近

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (14)*注記

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について