荷重報酬和モデルで表されるタスク族に対する一括強化学習法 Parallel Reinforcement Learning for Tasks with Weighted Sum of Partial Rewards

この論文にアクセスする

この論文をさがす

著者

抄録

Unlike ordinary reinforcement learning (RL) for a single task, RL for a family of tasks is desired in time-varying environments, multi-criteria problems, and inverse RL. In the present paper, a family of tasks is defined as weighted sum of partial rewards, and a parallel learning method is proposed for this family. Expected reward of the optimal policy is not linear in this case; it is a piecewise-linear convex function of weight values. Calculation of convex hulls and Minkowski sums realizes parallel Q-learning for all possible weight values at once, in spite of their infinite variations.

収録刊行物

  • 日本神経回路学会誌 = The Brain & neural networks  

    日本神経回路学会誌 = The Brain & neural networks 13(4), 137-145, 2006-12-05 

    Japanese Neural Network Society

参考文献:  14件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  2件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10018472522
  • NII書誌ID(NCID)
    AA11658570
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    1340766X
  • データ提供元
    CJP書誌  CJP引用  J-STAGE 
ページトップへ