マルコフ決定過程 : モデル化の基礎と応用事例

書誌事項

マルコフ決定過程 : モデル化の基礎と応用事例

前田康成著

森北出版, 2021.3

タイトル別名

Markov decision process

タイトル読み

マルコフ ケッテイ カテイ : モデルカ ノ キソ ト オウヨウ ジレイ

大学図書館所蔵 件 / 74

この図書・雑誌をさがす

注記

基本的なマルコフ決定過程、拡張したマルコフ決定過程の基礎と、推薦システムや金融工学などさまざまな意思決定問題への適用例を紹介。強化学習/深層強化学習、ベイズ学習などの機械学習についても解説する。

参考文献: p241-243

内容説明・目次

内容説明

MDPでモデル化するための地力を養う。強化学習・深層強化学習のしくみの理解にも役に立つ。アルゴリズムの徹底詳説×豊富な応用事例。

目次

  • マルコフ決定過程とは
  • マルコフ決定過程の基本的な問題設定とアルゴリズム
  • マルコフ決定過程の基本的な機械学習
  • 真のパラメータが変化するマルコフ決定過程
  • 状態、行動、利得に関する工夫
  • 推薦システムへの適用—基本的な非割引問題
  • 金融工学への適用—基本的な割引問題
  • ロールプレイングゲームへの適用—複数の情報で構成される状態+複数の独立な試行で構成される状態遷移確率によるモデル
  • 通信工学への適用—複数の情報で構成される状態+少数のパラメータで構成される状態遷移確率によるモデル
  • ベイズ流の仮説検定への適用—最後の期においてのみ利得が発生するモデル(基礎)
  • 教育工学への適用—最後の期においてのみ利得が発生するモデル(発展)
  • 設備保全、アセットマネジメントとヘルスケア支援への適用—良好な状態維持が目的のモデル
  • 深層強化学習の入口
  • 付録A マルコフ連鎖
  • 付録B 隠れマルコフモデル
  • 付録C ベイズ統計と統計的決定理論

「BOOKデータベース」 より

詳細情報

  • NII書誌ID(NCID)
    BC06499255
  • ISBN
    • 9784627855212
  • 出版国コード
    ja
  • タイトル言語コード
    jpn
  • 本文言語コード
    jpn
  • 出版地
    東京
  • ページ数/冊数
    v, 245p
  • 大きさ
    22cm
  • 分類
  • 件名
ページトップへ