報酬設計を通した社会的相互作用による行為概念群の構築:シェマ理論に基づいた累増的強化学習

書誌事項

タイトル別名
  • Construction of Behavioral Concepts through Social Interactions based on Reward Design: Schema-Based Incremental Reinforcement Learning
  • ホウシュウ セッケイ オ トオシタ シャカイテキ ソウゴ サヨウ ニ ヨル コウイ ガイネングン ノ コウチク シェマ リロン ニ モトヅイタ ルイゾウテキ キョウカ ガクシュウ

この論文をさがす

抄録

本稿ではJ. Piagetのシェマ理論における同化・調節及び均衡化・分化の概念を強化学習の枠組みに適用することにより累増的に行為概念を獲得することの出来る仕組みを提案する. この手法はただ一つの報酬チャンネルを用いた相互作用を用いてユーザや環境と相互作用する中で様々な行為を獲得していくことの出来る自律ロボットの実現を目指したものである. 提案手法は広く一般のTD学習に適用可能である. 本稿ではQ学習と双シェマモデルにおける強化学習に適用した実験例を示す. いずれの場合にも教師の明示的な指示なしに, 強化学習器を分化させ複数の行為概念を獲得することが出来る. また, この仕組みにより報酬は新規の行為を獲得させるという役割以外に, 獲得した行為を想起させるという役割を担うようになる.

収録刊行物

  • 知能と情報

    知能と情報 18 (4), 629-640, 2006

    日本知能情報ファジィ学会

被引用文献 (2)*注記

もっと見る

参考文献 (40)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ