段階的な視覚をもつエージェントにおける強化学習について : 追跡問題を例にして  [in Japanese] Reinforcement Learning of Agents with a Staged View for the Pursuit Problem  [in Japanese]

Access this Article

Search this Article

Author(s)

    • 山村 忠義 YAMAMURA Tadayoshi
    • 大阪府立大学大学院理学系研究科情報数理科学専攻 Department of Mathematics and Information Sciences, Graduate School of Science, Osaka Prefecture University
    • 馬野 元秀 UMANO Motohide
    • 大阪府立大学大学院理学系研究科情報数理科学専攻 Department of Mathematics and Information Sciences, Graduate School of Science, Osaka Prefecture University
    • 瀬田 和久 SETA Kazuhisa
    • 大阪府立大学大学院理学系研究科情報数理科学専攻 Department of Mathematics and Information Sciences, Graduate School of Science, Osaka Prefecture University

Abstract

自律的な行動と学習を行うエージェントの研究においては, エージェントの視覚は絶対座標に基づいており, 正確な情報が入る範囲と入らない範囲に明確に分かれていた. 本論文では, 相対座標に基づき, 距離と方向に応じて見え方が変わり, 段階的に大雑把な情報しか得られない視覚を考える. 近傍では正確な情報が入るが, 距離が遠くなると情報が大雑把となり, 記号化された「近距離」や「中距離」であることしか分からず, 見えている対象物の区別もつきにくくなり, 方向も「左」「左前」「前」「右前」「右」と記号化される. これは, 人間の視覚がもつ「距離が大きくなるにつれて見えにくくなる」と「正面はよく見えるが, 左右の方向は見えにくい」という性質を反映させている. そして, マルチエージェントの標準問題としてよく用いられる追跡問題を例題にとり, このような視覚をもつエージェントがQ-learningを基にした強化学習を行うときに, 効果的な学習が行われることをシミュレーションにより示す.

An autonomous agent has a ranged view using the absolute coordinate system, where it can receive accurate information in the range but noting out of the range. This is a considerably artificial situation. In this paper, we propose a staged view in distance and direction using the relative coordinate system, where an agent receives accurate information in the neighborhood but only rough symbolized distance and direction and rough distinction of other agents in short and middle-distance areas. It reflects a human's view that it can see easily an object in the neighborhood but more difficultly in the longer distance and easily in the center direction but more difficultly in the righter and lefter directions. We show by a numerical experiment for the pursuit problem, a multi-agent's benchmark problem, that the agent with the staged view learns effectively using Q-learning.

Journal

  • Journal of Japan Society for Fuzzy Theory and Intelligent Informatics

    Journal of Japan Society for Fuzzy Theory and Intelligent Informatics 18(4), 561-570, 2006-08-15

    Japan Society for Fuzzy Theory and intelligent informatics

References:  23

Cited by:  1

Codes

  • NII Article ID (NAID)
    110004814947
  • NII NACSIS-CAT ID (NCID)
    AA1181479X
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    13477986
  • NDL Article ID
    8069765
  • NDL Source Classification
    ZM31(科学技術--数学) // ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z15-649
  • Data Source
    CJP  CJPref  NDL  NII-ELS  J-STAGE 
Page Top