長遅延報酬対象向け強化学習手法 Practical reinforcement learning for long delayed reward problems

この論文をさがす

著者

    • 若原, 拓己 ワカハラ, タクミ

書誌事項

タイトル

長遅延報酬対象向け強化学習手法

タイトル別名

Practical reinforcement learning for long delayed reward problems

著者名

若原, 拓己

著者別名

ワカハラ, タクミ

学位授与大学

公立はこだて未来大学

取得学位

博士(システム情報科学)

学位授与番号

甲第21号

学位授与年月日

2013-03-21

注記・抄録

博士論文

指導教員:三上 貞芳

11アクセス

各種コード

  • NII論文ID(NAID)
    500000573458
  • NII著者ID(NRID)
    • 8000000575779
  • 本文言語コード
    • jpn
  • NDL書誌ID
    • 024699321
  • データ提供元
    • 機関リポジトリ
    • NDL ONLINE
ページトップへ