ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理
Author(s)
Bibliographic Information
ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理
技術評論社, 2020.7
- Other Title
-
IT (あいてぃ) エンジニアのための強化学習理論入門 (きょうかがくしゅうりろんにゅうもん)
Reinforcement learning for software engineers
強化学習理論入門 : ITエンジニアのための : Pythonで学ぶアルゴリズムの動作原理
- Title Transcription
-
IT エンジニア ノ タメ ノ キョウカ ガクシュウ リロン ニュウモン : Python デ マナブ アルゴリズム ノ ドウサ ゲンリ
Available at / 117 libraries
-
Prefectural University of Hiroshima Library and Academic Information Center
007.13/N34110082383
-
University of Tsukuba Library, Library on Library and Information Science
007.13-N3410020013061
-
No Libraries matched.
- Remove all filters.
Search this Book/Journal
Note
スキルアップや強化学習の活用に向けた準備をしようと考えるITエンジニアに向けて、強化学習の基礎となるアルゴリズムを体系的に解説する。Pythonサンプルコードのダウンロードサービス付き。
参考書籍: p277
Description and Table of Contents
Description
強化学習の基礎となるアルゴリズムを体系的に学ぶ。
Table of Contents
- 1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編))
- 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定)
- 3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例)
- 4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法)
- 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)
by "BOOK database"