適応的探索法を用いた強化学習

梅迫 公輔, 大林 正直, 小林 邦和

doi:10.1541/ieejeiss1987.122.3_374

書誌事項

タイトル別名

Reinforcement Learning Using Adaptive Search Method
テキオウテキタンサクホウオモチイタキョウカガクシュウ

この論文をさがす

抄録

We propose an adaptive probability density function (PDF) to select an effective action on reinforcement learning (RL). The uniform distribution function and the normal distribution function of an action are often used to select an action. When these fuctions are used, however, the information of search direction is net considered. The proposed method utilizing the information of it enables RL to reduce the number of trials, which is needed to real environment learning. Furthermore, the proposed method can be applied easily to various methods of RL, for example, actor-critic, stochastic gradient ascent method. The performance of our proposed method is demonstrated by computer simulations.

収録刊行物

電気学会論文誌Ｃ（電子・情報・システム部門誌）

電気学会論文誌Ｃ（電子・情報・システム部門誌） 122 (3), 374-380, 2002

一般社団法人電気学会

キーワード

詳細情報詳細情報について

CRID: 1390001204610778240

NII論文ID: 130006845666; 10007790520

NII書誌ID: AN10065950

DOI: 10.1541/ieejeiss1987.122.3_374

ISSN: 13488155; 03854221; http://id.crossref.org/issn/03854221

NDL書誌ID: 6089026

Web Site: https://ndlsearch.ndl.go.jp/books/R000000004-I6089026; https://www.jstage.jst.go.jp/article/ieejeiss1987/122/3/122_3_374/_pdf

データソース種別

JaLC
NDL
Crossref
CiNii Articles

抄録ライセンスフラグ: 使用不可

適応的探索法を用いた強化学習

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (2)*注記

参考文献 (11)*注記

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

適応的探索法を用いた強化学習

書誌事項

この論文をさがす

抄録

収録刊行物

被引用文献 (2)*注記

参考文献 (11)*注記

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について