ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理
著者
書誌事項
ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理
技術評論社, 2020.7
- タイトル別名
-
IT (あいてぃ) エンジニアのための強化学習理論入門 (きょうかがくしゅうりろんにゅうもん)
Reinforcement learning for software engineers
強化学習理論入門 : ITエンジニアのための : Pythonで学ぶアルゴリズムの動作原理
- タイトル読み
-
IT エンジニア ノ タメ ノ キョウカ ガクシュウ リロン ニュウモン : Python デ マナブ アルゴリズム ノ ドウサ ゲンリ
大学図書館所蔵 件 / 全116件
-
該当する所蔵館はありません
- すべての絞り込み条件を解除する
この図書・雑誌をさがす
注記
スキルアップや強化学習の活用に向けた準備をしようと考えるITエンジニアに向けて、強化学習の基礎となるアルゴリズムを体系的に解説する。Pythonサンプルコードのダウンロードサービス付き。
参考書籍: p277
内容説明・目次
内容説明
強化学習の基礎となるアルゴリズムを体系的に学ぶ。
目次
- 1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編))
- 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定)
- 3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例)
- 4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法)
- 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)
「BOOKデータベース」 より