Generative Adversarial Imitation Learningにタスク達成報酬を付加した動作の学習

DOI

書誌事項

タイトル別名
  • Learning actions using Generative Adversarial Imitation Learning added task achievement reward

抄録

<p>マニピュレーションタスクにおいて,人間の腕のような複雑な動作のプログラムを手動で作成することは非常にコストが高い. 一方,機械学習を用いたマニピュレーション制御は行動の取りうる範囲が膨大であるため,ロボットが人間によるデモンストレーション無しで学習を行うことは困難である. このような理由から,人間の教示によってロボットの動作を獲得することが必要である. 本研究では,近年のLearning from Demonstration (LfD)の代表的な手法であるGenerative Adversarial Imitation Learning (GAIL) に基づき,タスク達成報酬を新たに導入することで,タスクのゴールが存在するシミュレーション環境のマニピュレーション学習を行う. 結果として,提案手法は一部のタスクにおいてエキスパート軌道のスコアと同等のスコアを示す方策の学習に成功した.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390564238000844032
  • NII論文ID
    130007427344
  • DOI
    10.11517/pjsai.jsai2018.0_2l2os6a03
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ