価値の概念を導入した強化学習システム

岡本 隆志, 大林 正直, 呉本 尭, 小林 邦和, 馮 良炳

doi:10.14864/fss.26.0.262.0

書誌事項

タイトル別名

A reinforcement learning system incorporating within the concept of value

抄録

不確実性を伴う環境中でエージェントが適切な行動を取り続けるには、エージェント自身で自身の行動が引き起こす環境の変化が良いか悪いかを自ら判定する手段を持っていなければならない。一方で、神経生理学の分野では、生物の作り出す価値における研究について多く報告されており、著者らはそのような高度な知能を持つ生物のメカニズムに着目した。以上より、本研究では、立脚性を有するエージェントシステムの構築を目的とし、従来の強化学習システムにエージェントの内部評価機構となる価値システムを付加した新たな学習システムを提案する。計算機シミュレーションでは、提案法を迷路探索問題に適用し、従来の強化学習システムと比較することによって価値の考えを導入した提案システムが有効であることを示す。さらに、価値の考えをいくつかの代表的な強化学習システムへ付加して検証を行い、価値システムの汎用性を示す。

収録刊行物

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集

日本知能情報ファジィ学会ファジィシステムシンポジウム講演論文集 26 (0), 262-262, 2010

日本知能情報ファジィ学会

キーワード

詳細情報詳細情報について

CRID: 1390282680650537984

NII論文ID: 130005035518

DOI: 10.14864/fss.26.0.262.0

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

価値の概念を導入した強化学習システム

書誌事項

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

価値の概念を導入した強化学習システム

書誌事項

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について