ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理

Bibliographic Information

ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理

中井悦司著

技術評論社, 2020.7

Other Title

IT (あいてぃ) エンジニアのための強化学習理論入門 (きょうかがくしゅうりろんにゅうもん)

Reinforcement learning for software engineers

強化学習理論入門 : ITエンジニアのための : Pythonで学ぶアルゴリズムの動作原理

Title Transcription

IT エンジニア ノ タメ ノ キョウカ ガクシュウ リロン ニュウモン : Python デ マナブ アルゴリズム ノ ドウサ ゲンリ

Available at  / 117 libraries

Note

スキルアップや強化学習の活用に向けた準備をしようと考えるITエンジニアに向けて、強化学習の基礎となるアルゴリズムを体系的に解説する。Pythonサンプルコードのダウンロードサービス付き。

参考書籍: p277

Description and Table of Contents

Description

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

Table of Contents

  • 1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編))
  • 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定)
  • 3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例)
  • 4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法)
  • 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)

by "BOOK database"

Details

  • NCID
    BB31671001
  • ISBN
    • 9784297115159
  • Country Code
    ja
  • Title Language Code
    jpn
  • Text Language Code
    jpn
  • Place of Publication
    東京
  • Pages/Volumes
    xii, 283p
  • Size
    21cm
  • Classification
  • Subject Headings
Page Top