The policy gradient on the average reward manifold

書誌事項

タイトル別名
  • 平均報酬の多様体に基づく方策勾配法
  • ニューロコンピューティング
  • ニューロ コンピューティング

この論文をさがす

収録刊行物

参考文献 (22)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ