失敗確率伝播アルゴリズムEFPAの提案とマルチエージェント環境下での有効性の検証

村岡 宏紀, 宮崎 和光, 小林 博明

doi:10.1541/ieejeiss.136.273

書誌事項

タイトル別名

Proposal of a Propagation Algorithm of the Expected Failure Probability and the Effectiveness on Multi-agent Environments
シッパイカクリツデンパアルゴリズム EFPA ノテイアントマルチエージェントカンキョウカデノユウコウセイノケンショウ

この論文をさがす

抄録

It is known that Improved Penalty Avoiding Rational Policy Making algorithm (IPARP) can learn policies by a reward and a penalty. IPARP aims to identify penalty rules that have a high possibility to receive a penalty. Though IPARP is effective in many cases, it needs many trial-and-error searches due to memory constraints. In this paper, we propose a method called Expected Failure Probability Algorithm (EFPA) to speed it up. In addition, we extend EFPA to multi-agent environments. In multi-agent learning, it is important to avoid concurrent learning problem that occurs when multiple agents learn simultaneously. We also propose a method to avoid the problem and confirm the effectiveness by numerical experiments.

収録刊行物

電気学会論文誌Ｃ（電子・情報・システム部門誌）

電気学会論文誌Ｃ（電子・情報・システム部門誌） 136 (3), 273-281, 2016

一般社団法人電気学会

キーワード

詳細情報詳細情報について

CRID: 1390001204607796736

NII論文ID: 130005132275

NII書誌ID: AN10065950

DOI: 10.1541/ieejeiss.136.273

ISSN: 13488155; 03854221

NDL書誌ID: 027160085

Web Site: https://ndlsearch.ndl.go.jp/books/R000000004-I027160085; https://www.jstage.jst.go.jp/article/ieejeiss/136/3/136_273/_pdf

本文言語コード: ja

データソース種別

JaLC
NDL
Crossref
CiNii Articles
KAKEN

抄録ライセンスフラグ: 使用不可

失敗確率伝播アルゴリズムEFPAの提案とマルチエージェント環境下での有効性の検証

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (3)*注記

参考文献 (16)*注記

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

失敗確率伝播アルゴリズムEFPAの提案とマルチエージェント環境下での有効性の検証

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (3)*注記

参考文献 (16)*注記

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について