内的報酬と敵対的学習によるタスク非依存な注意機構の学習

松嶋 達也, 大澤 昇平, 松尾 豊

doi:10.11517/pjsai.jsai2018.0_3a101

書誌事項

タイトル別名

Task-free Attention Learning with Intrinsic Reward and Adversarial Learning

抄録

<p>近年，人工知能の活用による社会の生産性向上への期待が高まっている．この期待の背景として，深層学習が人工知能技術のブレイクスルーになったことが挙げられる．しかし，実世界環境で活用可能な人工知能の構築には，いくつかの課題が残されている．特に，観測が部分的であること，タスクに対する報酬の設計が難しいことの2 点が挙げられる．部分的な観測を扱うニューラルネットワークのモデルとして，注意機構を持つモデルが提案されている．しかし，これらのモデルでは，注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており，外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない．本研究では，注意機構の学習に外的な報酬を用いる代わりに，観測に対する予測の誤差を注意機構の内的な報酬として与え，観測の予測モデルと注意機構を敵対的な学習により訓練する手法を提案する．</p>

収録刊行物

人工知能学会全国大会論文集

人工知能学会全国大会論文集 JSAI2018 (0), 3A101-3A101, 2018

一般社団法人人工知能学会

詳細情報詳細情報について

CRID: 1390001288046645760

NII論文ID: 130007424969

DOI: 10.11517/pjsai.jsai2018.0_3a101

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

内的報酬と敵対的学習によるタスク非依存な注意機構の学習

書誌事項

抄録

収録刊行物

詳細情報詳細情報について

書き出し

問題の指摘

内的報酬と敵対的学習によるタスク非依存な注意機構の学習

書誌事項

抄録

収録刊行物

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について