5分で分かる!? 有名論文ナナメ読み:Sergey Levine : Reinforcement Learning and Control as Probabilistic Inference : Tutorial and Review

この論文をさがす

抄録

強化学習は経験データから最適な方策を学習する方法論である.深層学習ブームにより多くの人が機械学習に触れる機会が増え,技術を理解する人も増えた印象である.しかし強化学習に限っては,その異質さから新規参入を阻んでいる.これは強化学習が,教師あり学習に代表される入出力関係の推論問題ではなく,報酬よって間接的に提示される理想的な出力を獲得する制御問題に類することに起因する.本稿が紹介する論文では,このギャップを埋めるべく,強化学習を推論問題として捉えるための新たな解釈を提供している.ギャップを埋めるために余計小難しくなっている印象は否めないが,本稿ではその要点をなるべく簡潔に解説する.

収録刊行物

  • 情報処理

    情報処理 62 (1), 34-35, 2020-12-15

    [出版社不明]

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ