5分で分かる!? 有名論文ナナメ読み：Sergey Levine : Reinforcement Learning and Control as Probabilistic Inference : Tutorial and Review

小林 泰介

doi:10.20729/00208803

強化学習は経験データから最適な方策を学習する方法論である．深層学習ブームにより多くの人が機械学習に触れる機会が増え，技術を理解する人も増えた印象である．しかし強化学習に限っては，その異質さから新規参入を阻んでいる．これは強化学習が，教師あり学習に代表される入出力関係の推論問題ではなく，報酬よって間接的に提示される理想的な出力を獲得する制御問題に類することに起因する．本稿が紹介する論文では，このギャップを埋めるべく，強化学習を推論問題として捉えるための新たな解釈を提供している．ギャップを埋めるために余計小難しくなっている印象は否めないが，本稿ではその要点をなるべく簡潔に解説する．

5分で分かる!? 有名論文ナナメ読み：Sergey Levine : Reinforcement Learning and Control as Probabilistic Inference : Tutorial and Review

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

5分で分かる!? 有名論文ナナメ読み：Sergey Levine : Reinforcement Learning and Control as Probabilistic Inference : Tutorial and Review

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について