Sample mean based index policies with O(log n) regret for the multi-armed bandit problem

被引用文献1件

AGRAWAL R.

収録刊行物

Adv. Appl. Prob.

Adv. Appl. Prob. 27 1054-1078, 1995

被引用文献 (1)*注記

もっと見る

詳細情報詳細情報について

CRID

1571698601173282432
NII論文ID

10027289396
データソース種別
- CiNii Articles

書き出し

問題の指摘

ページトップへ