自然TD学習:割引報酬におけるTD誤差を利用する自然方策勾配に基づいた強化学習法

書誌事項

タイトル別名
  • シゼン TD ガクシュウ ワリビキ ホウシュウ ニ オケル TD ゴサ オ リヨウ スル シゼン ホウサク コウバイ ニ モトヅイタ キョウカ ガクシュウホウ

この論文をさがす

収録刊行物

参考文献 (17)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ