Optimality conditions for a Markov decision chain with unbounded costs-Reference-Cited by-同舟云学术

Optimality conditions for a Markov decision chain with unbounded costs

Published:1980-12 Issue:4 Volume:17 Page:996-1003
ISSN:0021-9002
Container-title:Journal of Applied Probability
language:en
Short-container-title:Journal of Applied Probability

Author:

Robinson D. R.

Abstract

It is known that when costs are unbounded satisfaction of the appropriate dynamic programming ‘optimality' equation by a policy is not sufficient to guarantee its average optimality. A ‘lowest-order potential' condition is introduced which, along with the dynamic programming equation, is sufficient to establish the optimality of the policy. Also, it is shown that under fairly general conditions, if the lowest-order potential condition is not satisfied there exists a non-memoryless policy with smaller average cost than the policy satisfying the dynamic programming equation.

Publisher

Cambridge University Press (CUP)

Subject

Statistics, Probability and Uncertainty,General Mathematics,Statistics and Probability

Reference11 articles.

1. Markov Chains with Stationary Transition Probabilities

2. On the convergence of moments in stationary Markov chains

3. Optimal stationary policies for denumerable Markov chains in continuous time

4. A Solution to a Countable System of Equations Arising in Markovian Decision Processes

Cited by 4 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. The Poisson Equation for Countable Markov Chains: Probabilistic Methods and Interpretations;International Series in Operations Research & Management Science;2002

2. Bibliography;Markov Decision Processes;1994-04-15

3. Discrete-Time Controlled Markov Processes with Average Cost Criterion: A Survey;SIAM Journal on Control and Optimization;1993-03

4. Denumerable Undiscounted Semi-Markov Decision Processes with Unbounded Rewards;Mathematics of Operations Research;1983-05