価値の概念を導入した強化学習システム

DOI

書誌事項

タイトル別名
  • A reinforcement learning system incorporating within the concept of value

抄録

不確実性を伴う環境中でエージェントが適切な行動を取り続けるには、エージェント自身で自身の行動が引き起こす環境の変化が良いか悪いかを自ら判定する手段を持っていなければならない。一方で、神経生理学の分野では、生物の作り出す価値における研究について多く報告されており、著者らはそのような高度な知能を持つ生物のメカニズムに着目した。以上より、本研究では、立脚性を有するエージェントシステムの構築を目的とし、従来の強化学習システムにエージェントの内部評価機構となる価値システムを付加した新たな学習システムを提案する。計算機シミュレーションでは、提案法を迷路探索問題に適用し、従来の強化学習システムと比較することによって価値の考えを導入した提案システムが有効であることを示す。さらに、価値の考えをいくつかの代表的な強化学習システムへ付加して検証を行い、価値システムの汎用性を示す。

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390282680650537984
  • NII論文ID
    130005035518
  • DOI
    10.14864/fss.26.0.262.0
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ