強化学習編
著者
書誌事項
強化学習編
(ゼロから作るdeep learning / 斎藤康毅著, 4)
オライリー・ジャパン , オーム社 (発売), 2022.4
- タイトル別名
-
強化学習編
- タイトル読み
-
キョウカ ガクシュウ ヘン
大学図書館所蔵 全314件
  青森
  岩手
  宮城
  秋田
  山形
  福島
  茨城
  栃木
  群馬
  埼玉
  千葉
  東京
  神奈川
  新潟
  富山
  石川
  福井
  山梨
  長野
  岐阜
  静岡
  愛知
  三重
  滋賀
  京都
  大阪
  兵庫
  奈良
  和歌山
  鳥取
  島根
  岡山
  広島
  山口
  徳島
  香川
  愛媛
  高知
  福岡
  佐賀
  長崎
  熊本
  大分
  宮崎
  鹿児島
  沖縄
  韓国
  中国
  タイ
  イギリス
  ドイツ
  スイス
  フランス
  ベルギー
  オランダ
  スウェーデン
  ノルウェー
  アメリカ
この図書・雑誌をさがす
注記
参考文献: p343-347
索引: p349-355
内容説明・目次
内容説明
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
目次
- 1章 バンディット問題
- 2章 マルコフ決定過程
- 3章 ベルマン方程式
- 4章 動的計画法
- 5章 モンテカルロ法
- 6章 TD法
- 7章 ニューラルネットワークとQ学習
- 8章 DQN
- 9章 方策勾配法
- 10章 さらに先へ
- 付録
「BOOKデータベース」 より