ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理

書誌事項

ITエンジニアのための強化学習理論入門 : Pythonで学ぶアルゴリズムの動作原理

中井悦司著

技術評論社, 2020.7

タイトル別名

IT (あいてぃ) エンジニアのための強化学習理論入門 (きょうかがくしゅうりろんにゅうもん)

Reinforcement learning for software engineers

強化学習理論入門 : ITエンジニアのための : Pythonで学ぶアルゴリズムの動作原理

タイトル読み

IT エンジニア ノ タメ ノ キョウカ ガクシュウ リロン ニュウモン : Python デ マナブ アルゴリズム ノ ドウサ ゲンリ

大学図書館所蔵 件 / 116

この図書・雑誌をさがす

注記

スキルアップや強化学習の活用に向けた準備をしようと考えるITエンジニアに向けて、強化学習の基礎となるアルゴリズムを体系的に解説する。Pythonサンプルコードのダウンロードサービス付き。

参考書籍: p277

内容説明・目次

内容説明

強化学習の基礎となるアルゴリズムを体系的に学ぶ。

目次

  • 1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編))
  • 2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定)
  • 3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例)
  • 4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法)
  • 5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BB31671001
  • ISBN
    • 9784297115159
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 出版地
    東京
  • ページ数/冊数
    xii, 283p
  • 大きさ
    21cm
  • 分類
  • 件名
ページトップへ