将棋の棋譜を利用した,大規模な評価関数の調整

書誌事項

タイトル別名
  • Learning of Evaluation Functions by Game Records in Shogi

抄録

棋譜を教師とした評価関数の調整は古くから研究されてきたが,将棋のような複雑なゲームで実用となったのは最近のことで,明らかになっていない点も未だ多い.現在有望とされる手法は,棋譜の指手が選ばれるように評価関数を調整するもので,探索により最善応手手順を求めることと,最善応手手順後の局面を比較して評価値を調整することを繰り返す.本稿では一般的なモデルを提案し,用いる損失関数の違いや訓練例の与え方が得られる評価関数にどのように影響するかを議論する.さらに,実際に2 万を越える特徴で学習させ,強いプログラムの評価関数の作成に成功したことを報告する.

This paper presents a general framework for learning of evaluation functions, based on comparison of sibling nodes appeared in a large database of game records. In the framework, the weights of evaluation functions are adjusted so that the value of the move selected by human players become higher than that of the other legal moves, where the value of a move is the evaluation value of the position at the leaf of the principal variation after the move computed by search. In our experiments in Shogi, we compared the effectiveness of four kinds of loss functions as well as other parameters in the framework. Then, we report that the weights of more than 20 thousands of features were successfully adjusted in our method.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050292572137386624
  • NII論文ID
    170000080354
  • Web Site
    http://id.nii.ac.jp/1001/00097687/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ