Point-Based Value Iteration for Continuous POMDPs

15 years 2 months ago

Download jmlr.csail.mit.edu

We propose a novel approach to optimize Partially Observable Markov Decisions Processes (POMDPs) defined on continuous spaces. To date, most algorithms for model-based POMDPs are restricted to discrete states, actions, and observations, but many real-world problems such as, for instance, robot navigation, are naturally defined on continuous spaces. In this work, we demonstrate that the value function for continuous POMDPs is convex in the beliefs over continuous state spaces, and piecewise-linear convex for the particular case of discrete observations and actions but still continuous states. We also demonstrate that continuous Bellman backups are contracting and isotonic ensuring the monotonic convergence of value-iteration algorithms. Relying on those properties, we extend the PERSEUS algorithm, originally developed for discrete POMDPs, to work in continuous state spaces by representing the observation, transition, and reward models using Gaussian mixtures, and the beliefs using Gaus...

Josep M. Porta, Nikos A. Vlassis, Matthijs T. J. S

Real-time Traffic

Algorithm | Continuous Spaces | JMLR 2006 | Observable Markov Decisions |

claim paper

» Monte Carlo Value Iteration for ContinuousState POMDPs

» Belief Selection in PointBased Planning Algorithms for POMDPs

» Improving Anytime PointBased Value Iteration Using Principled Point Selections

» Anytime PointBased Approximations for Large POMDPs

» PointBased Policy Iteration

» Prioritizing PointBased POMDP Solvers

» Pointbased value iteration An anytime algorithm for POMDPs

» Planning with Continuous Actions in Partially Observable Environments

Post Info
More Details (n/a)

Added	13 Dec 2010
Updated	13 Dec 2010
Type	Journal
Year	2006
Where	JMLR
Authors	Josep M. Porta, Nikos A. Vlassis, Matthijs T. J. Spaan, Pascal Poupart

Comments (0)

Sciweavers

Point-Based Value Iteration for Continuous POMDPs

Algorithm | Continuous Spaces | JMLR 2006 | Observable Markov Decisions |

Explore & Download

Productivity Tools

Document Tools

Image Tools

Sciweavers