An Information-Theoretic Analysis of Return Maximization in Reinforcement Learning

IWATA, Kazunori, 岩田, 一貴

doi:10.1016/j.neunet.2011.05.002

An Information-Theoretic Analysis of Return Maximization in Reinforcement Learning

DOI 機関リポジトリ Web Site Web Site 被引用文献1件参考文献34件

この論文をさがす

CiNii Books

抄録

application/pdf

We present a general analysis of return maximization in reinforcement learning. This analysis does not require assumptions of Markovianity, stationarity, and ergodicity for the stochastic sequential decision processes of reinforcement learning. Instead, our analysis assumes the asymptotic equipartition property fundamental to information theory, providing a substantially different view from that in the literature. As our main results, we show that return maximization is achieved by the overlap of typical and best sequence sets, and we present a class of stochastic sequential decision processes with the necessary condition for return maximization. We also describe several examples of best sequences in terms of return maximization in the class of stochastic sequential decision processes, which satisfy the necessary condition.

収録刊行物

Neural Networks

Neural Networks 24 (10), 1074-1081, 2011-12

Elsevier

被引用文献 (1)*注記

参考文献 (34)*注記

詳細情報詳細情報について

CRID

1050859536460069248
NII論文ID

120006353330
NII書誌ID

AA10680676
ISSN

08936080
DOI

10.1016/j.neunet.2011.05.002
Web Site

https://hiroshima-cu.repo.nii.ac.jp/records/1824

https://api.elsevier.com/content/article/PII:S0893608011001444?httpAccept=text/xml

https://api.elsevier.com/content/article/PII:S0893608011001444?httpAccept=text/plain
本文言語コード

en
資料種別

journal article
データソース種別
- IRDB
- Crossref
- CiNii Articles
- KAKEN

書き出し

問題の指摘

ページトップへ

An Information-Theoretic Analysis of Return Maximization in Reinforcement Learning

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (34)*注記

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

An Information-Theoretic Analysis of Return Maximization in Reinforcement Learning

この論文をさがす

抄録

収録刊行物

被引用文献 (1)*注記

参考文献 (34)*注記

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について