Continuous Upper Confidence Trees with Polynomial Exploration – Consistency-Reference-Cited by-同舟云学术

Continuous Upper Confidence Trees with Polynomial Exploration – Consistency

Published:2013 Issue: Volume: Page:194-209
ISSN:0302-9743
Container-title:Advanced Information Systems Engineering
language:
Short-container-title:

Author:

Auger David,Couëtoux Adrien,Teytaud Olivier

Publisher

Springer Berlin Heidelberg

Link

http://link.springer.com/content/pdf/10.1007/978-3-642-40988-2_13

Reference17 articles.

1. Lecture Notes in Artificial Intelligence;P. Auer,2007

2. Bellman, R.: Dynamic Programming. Princeton Univ. Press (1957)

3. Bertsimas, D., Litvinov, E., Sun, X.A., Zhao, J., Zheng, T.: Adaptive robust optimization for the security constrained unit commitment problem 28(1), 52–63 (2013)

4. Bourki, A., Coulm, M., Rolet, P., Teytaud, O., Vayssière, P.: Parameter Tuning by Simple Regret Algorithms and Multiple Simultaneous Hypothesis Testing. In: ICINCO 2010, Funchal, Madeira, Portugal, p. 10 (2010)

5. Bubeck, S., Munos, R., Stoltz, G., Szepesvári, C.: Online optimization in x-armed bandits. In: Koller, D., Schuurmans, D., Bengio, Y., Bottou, L. (eds.) NIPS, pp. 201–208. Curran Associates, Inc. (2008)

Cited by 22 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. An Automated Few-Shot Learning for Time-Series Forecasting in Smart Grid Under Data Scarcity;IEEE Transactions on Artificial Intelligence;2024-06

2. Online Immediate Orientation in Monte Carlo Counterfactual Regret Minimization for Simultaneous Games;2024 36th Chinese Control and Decision Conference (CCDC);2024-05-25

3. Decentralized decision making over random graphs for space domain awareness;Advances in Space Research;2024-05

4. M0RV Model: Advancing the MuZero Algorithm Through Strategic Data Optimization Reuse and Value Function Refinement;IEEE Access;2024

5. Automatic extension of a symbolic mobile manipulation skill set;Robotics and Autonomous Systems;2023-07