強化学習編

- 斎藤, 康毅サイトウ, コウキ

関連文献: 1件

著者

- 斎藤, 康毅サイトウ, コウキ

書誌事項

強化学習編

斎藤康毅著

（ゼロから作るdeep learning / 斎藤康毅著, 4）

オライリー・ジャパン , オーム社 (発売), 2022.4

タイトル別名: 強化学習編

タイトル読み: キョウカガクシュウヘン

大学図書館所蔵全314件

地域で絞り込む図書館で絞り込む OPACリンクありで絞り込む

北陸・甲信越地方

中国・四国地方

九州・沖縄地方

アジア地域

ヨーロッパ地域

スウェーデン

ノルウェー

その他海外

国内ILL参加館

日米ILL参加館

日韓ILL参加館

料金相殺可能館

愛知学院大学図書館情報センター図

007.1/029/403103019

OPAC
愛知県立大学長久手キャンパス図書館

007.13/Sa25/4205724626

OPAC
愛知工業大学附属図書館図

007.13||S004713772

OPAC
会津大学情報センター (附属図書館)

007.1/SJ0066578

OPAC
青森公立大学図書館

007.1||Sa25||4010100147668

OPAC
青森大学附属図書館

UG118547T

OPAC
青森中央学院大学・青森中央短期大学図書館情報センター図

007.13||S||4000090418

OPAC
青山学院大学図書館

002504864

OPAC
青山学院大学万代記念図書館(相模原分館)

882300740

OPAC
秋田県立大学附属図書館本荘キャンパス図書館

10238995

OPAC

すべての所蔵館を表示

この図書・雑誌をさがす

注記

参考文献: p343-347

索引: p349-355

内容説明・目次

内容説明

人気シリーズの第４弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。

目次

１章　バンディット問題
２章　マルコフ決定過程
３章　ベルマン方程式
４章　動的計画法
５章　モンテカルロ法
６章　ＴＤ法
７章　ニューラルネットワークとＱ学習
８章　ＤＱＮ
９章　方策勾配法
１０章　さらに先へ
付録

「BOOKデータベース」より

関連文献： 1件中 1-1を表示

詳細情報

NII書誌ID(NCID)
BC13737932
ISBN
- 9784873119755
出版国コード
ja
タイトル言語コード
jpn
本文言語コード
jpn
出版地
東京,東京
ページ数/冊数
xviii, 355p
大きさ
21cm
分類
- NDC8 : 007.1
- NDC9 : 007.13
- NDC10 : 007.13
- NDLC : M121
件名
- BSH : 深層学習
- NDLSH : 機械学習
親書誌ID
- BB26486055

書き出し

ページトップへ