We consider discounted Markov decision processes (MDPs) with countably-infinite state spaces, finite action spaces, and unbounded rewards. Typical examples of such MDPs are inventory management and ...
Certains résultats ont été masqués, car ils peuvent vous être inaccessibles.
Afficher les résultats inaccessibles