-
- 山田 和明
- 東洋大
書誌事項
- タイトル別名
-
- 2P1-F30 Q-learning in Continuous State and Action Spaces
抄録
This paper proposes the new Q-learning that can learn mapping from continue state spaces to continue action spaces. The proposed method estimates the expectation value of actions on a state by using artificial neural networks, and decides an action according to the distribution of the estimated expectation value. In this paper, we investigate the performance of the proposed method through two types of simple experimentations.
収録刊行物
-
- ロボティクス・メカトロニクス講演会講演概要集
-
ロボティクス・メカトロニクス講演会講演概要集 2010 (0), _2P1-F30_1-_2P1-F30_4, 2010
一般社団法人 日本機械学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390282680914868480
-
- NII論文ID
- 110008742202
-
- ISSN
- 24243124
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- Crossref
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可