Studies on optimal stopping problems for multi-armed bandit processes バンディト過程の最適停止問題に関する研究

この論文をさがす

著者

    • 吉田, 祐治 ヨシダ, ユウジ

書誌事項

タイトル

Studies on optimal stopping problems for multi-armed bandit processes

タイトル別名

バンディト過程の最適停止問題に関する研究

著者名

吉田, 祐治

著者別名

ヨシダ, ユウジ

学位授与大学

九州大学

取得学位

博士 (理学)

学位授与番号

乙第5333号

学位授与年月日

1993-01-27

注記・抄録

博士論文

目次

  1. Contents / p1 (0004.jp2)
  2. 1 Preface / p3 (0006.jp2)
  3. 2 The optimal stopping problem for multi-armed bandit processes / (0011.jp2)
  4. 2.1 Introduction / p9 (0012.jp2)
  5. 2.2 Multi-armed bandit processes / p9 (0012.jp2)
  6. 2.3 The optimal strategies and the optimal stopping times / p12 (0015.jp2)
  7. 2.4 The extended case with time constraints / p18 (0021.jp2)
  8. 2.5 The Markov case and the linear programming / p20 (0023.jp2)
  9. 2.6 Appendix for Section 2.4 / p24 (0027.jp2)
  10. 3 The optimal stopping problem for multi-armed diffusion bandit processes / (0029.jp2)
  11. 3.1 Introduction / p27 (0030.jp2)
  12. 3.2 Multi-armed diffusion bandit processes / p27 (0030.jp2)
  13. 3.3 The optimal tactics / p31 (0034.jp2)
  14. 3.4 The Bellman's equation / p37 (0040.jp2)
  15. 4 The multi-armed bandit game / (0042.jp2)
  16. 4.1 Introduction / p40 (0043.jp2)
  17. 4.2 Strategies and stopping times for bandit processes / p42 (0045.jp2)
  18. 4.3 Expected rewards and bandit games / p46 (0049.jp2)
  19. 4.4 The optimal values and the optimal tactics / p55 (0058.jp2)
  20. 4.5 Construction of the optimal tactics and the uniqueness of the optimal values / p57 (0060.jp2)
  21. 5 References / p61 (0064.jp2)
1アクセス

各種コード

  • NII論文ID(NAID)
    500000093357
  • NII著者ID(NRID)
    • 8000000093583
  • DOI(NDL)
  • NDL書誌ID
    • 000000257671
  • データ提供元
    • NDL-OPAC
    • NDLデジタルコレクション
ページトップへ