Percentile Criterion Optimization in Offline Reinforcement Learning

Published in Thirty-seventh Conference on Neural Information Processing Systems (Neurips 2023), 2023