強化学習アルゴリズム入門 : 「平均」からはじめる基礎と応用

書誌事項

強化学習アルゴリズム入門 : 「平均」からはじめる基礎と応用

曽我部東馬著

オーム社, 2019.5

タイトル別名

Reinforcement learning

平均からはじめる基礎と応用

タイトル読み

キョウカ ガクシュウ アルゴリズム ニュウモン : 「ヘイキン」カラ ハジメル キソ ト オウヨウ

大学図書館所蔵 件 / 189

この図書・雑誌をさがす

注記

PythonとMATLABのコード付き

参考文献: p198-199

索引: p200-202

内容説明・目次

内容説明

強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。

目次

  • 第1章 平均で学ぶ強化学習の基本概念(平均と期待値;平均と価値 ほか)
  • 第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S);動的計画法 ほか)
  • 第3章 関数近似手法(関数近似の基本概念;関数近似モデルを用いたV(St)の表現 ほか)
  • 第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰;DQNによる行動状態価値関数の近似 ほか)

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BB28248648
  • ISBN
    • 9784274223716
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 出版地
    東京
  • ページ数/冊数
    vii, 202p
  • 大きさ
    21cm
  • 分類
  • 件名
ページトップへ