Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

208

Voted

ICML
2001
IEEE

159views Machine Learning» more ICML 2001»

Direct Policy Search using Paired Statistical Tests

16 years 7 months ago

Direct Policy Search using Paired Statistical Tests

Download www.autonlab.org

Direct policy search is a practical way to solve reinforcement learning problems involving continuous state and action spaces. The goal becomes finding policy parameters that maximize a noisy objective function. The Pegasus method converts this stochastic optimization problem into a deterministic one, by using fixed start states and fixed random number sequences for comparing policies (Ng & Jordan, 1999). We evaluate Pegasus, and other paired comparison methods, using the mountain car problem, and a difficult pursuer-evader problem. We conclude that: (i) Paired tests can improve performance of deterministic and stochastic optimization procedures. (ii) Our proposed alternatives to Pegasus can generalize better, by using a different test statistic, or changing the scenarios during learning. (iii) Adapting the number of trials used for each policy comparison yields fast and robust learning.

Malcolm J. A. Strens, Andrew W. Moore

Real-time Traffic

ICML 2001 | Machine Learning | Policy Comparison Yields | Stochastic Optimization Problem | Stochastic Optimization Procedures |

claim paper

Related Content

» A comparison of statistical significance tests for information retrieval evaluation

» SIGffRid A tool to search for sigma factor binding sites in bacterial genomes using compar...

» A Recursive Method for Structural Learning of Directed Acyclic Graphs

» A Directed Mutation Operator for Real Coded Genetic Algorithms

» Guiding Inference with Policy Search Reinforcement Learning

» MonteCarlo simulation balancing

» Word Reordering and DPbased Search in Statistical Machine Translation

» Constructing Test Suites for Interaction Testing

» Measuring the similarity between implicit semantic relations using web search engines

Post Info
More Details (n/a)

Added	17 Nov 2009
Updated	17 Nov 2009
Type	Conference
Year	2001
Where	ICML
Authors	Malcolm J. A. Strens, Andrew W. Moore

Comments (0)