Markov Multi-armed Bandit-Reference-Cited by-同舟云学术

登录注册会员服务联系我们

Markov Multi-armed Bandit

Published:2016 Issue: Volume: Page:27-39
ISSN:2366-1186
Container-title:Wireless Networks
language:
Short-container-title:

Author:

Zheng Rong,Hua Cunqing

Publisher

Springer International Publishing

Link

http://link.springer.com/content/pdf/10.1007/978-3-319-50502-2_3

Reference12 articles.

1. Richard Bellman. “A Markovian Decision Process”. In: Journal of Mathematics and Mechanics 6 (1957).

2. Richard Bellman. Dynamic Programming. 1st ed. Princeton, NJ, USA: Princeton University Press, 1957.

3. John C Gittins. “Bandit processes and dynamic allocation indices”. In: Journal of the Royal Statistical Society. Series B (Methodological) (1979), pp. 148–177.

4. Ronald A. Howard. Dynamic Programming and Markov Processes. Technology Press and Wiley, 1960.

5. Thomas Jaksch, Ronald Ortner, and Peter Auer. “Near-optimal regret bounds for reinforcement learning”. In: Journal of Machine Learning Research 11.Apr (2010), pp. 1563–1600.

Cited by 3 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. MAB-Based 3-Way Neighbor Discovery for Wireless Networks Using Directional Antennas;2022 IEEE 95th Vehicular Technology Conference: (VTC2022-Spring);2022-06

2. Content-Based Image Copy Detection Using Convolutional Neural Network;Electronics;2020-12-01

3. Modeling and Management Big Data in Databases—A Systematic Literature Review;Sustainability;2020-01-15

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线，采集、加工和组织学术论文而形成的新型学术文献查询和分析系统，可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容，当前同舟云学术共收录了国内外主流学术期刊6万余种，收集的期刊论文及会议论文总量共计约1.5亿篇，并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询！咨询电话：010-8811{复制后删除}0370

www.globalauthorid.com

TOP