抄録
人間やロボットなどにおける感覚運動統合において, ダイナミクス整合という概念を提起する. これは有限の計算資源やハードウェアの物理的特性や制御系の制約, タスクの内容といった拘束条件の下で, 情報処理系や制御系の時間的な特性, すなわちダイナミクスを適応的・能動的に調整することによって, システム全体としてのパフォーマンスの最大化を実現するという考えである. 本稿ではこの問題に対する一つのアプローチとして, パフォーマンスを報酬とした強化学習を用いることにより具体的なアルゴリズムを構成し, ターゲットトラッキングを例題とした数値実験によりその効果を検証した.
The authors propose a novel concept named "dynamics matching" for designing sensory-motor fusion system. This means a strategy to adjust adaptively the contents of the information processing and the control to maximize overall performance of the system under constraints such as restricted computational resources, physical properties of the sensor and motor systems and requirements by given tasks. The authors construct an algorithm utilizing reinforcement learning where the system performance is regarded as the "reward." The effect of the proposed concept is illustrated by a numerical experiment of a target-tracking task.