Geometric Policy Iteration for Markov Decision Processes-Reference-Cited by-同舟云学术

Geometric Policy Iteration for Markov Decision Processes

Published:2022-08-14 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
language:
Short-container-title:

Author:

Wu Yue¹,De Loera Jesús A.¹

Affiliation:

1. University of California, Davis, Davis, CA, USA

Funder

NSF (National Science Foundation)

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3534678.3539478

Reference33 articles.

1. Marianne Akian and Stéphane Gaubert . 2013. Policy iteration for perfect information stochastic mean payoff games with bounded first return times is strongly polynomial. arXiv: Optimization and Control ( 2013 ). Marianne Akian and Stéphane Gaubert. 2013. Policy iteration for perfect information stochastic mean payoff games with bounded first return times is strongly polynomial. arXiv: Optimization and Control (2013).

2. Richard E. Bellman . 1957. Dynamic Programming . Princeton University Press . 392 pages. Richard E. Bellman. 1957. Dynamic Programming. Princeton University Press. 392 pages.

3. Dimitri P. Bertsekas and John N. Tsitsiklis. 1989. Convergence Rate and Termination of Asynchronous Iterative Algorithms . In Proceedings of the 3rd International Conference on Supercomputing. Association for Computing Machinery, 461--470 . Dimitri P. Bertsekas and John N. Tsitsiklis. 1989. Convergence Rate and Termination of Asynchronous Iterative Algorithms. In Proceedings of the 3rd International Conference on Supercomputing. Association for Computing Machinery, 461--470.

Cited by 1 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Algebraic optimization of sequential decision problems;Journal of Symbolic Computation;2024-03