safe-planning

#safe-planning

DiRecT: Safe Diffusion-Based Planning via Receding-Horizon Denoising

arXiv cs.LG ↗ · 4d ago Cached

DiRecT introduces a training-free algorithm for safe diffusion-based planning that enforces constraints only on final clean trajectories using receding-horizon denoising, improving safety and performance over existing methods.

0 favorites 0 likes

#safe-planning

Imperfect World Models are Exploitable

arXiv cs.AI ↗ · 2026-05-18 Cached

This paper formalizes model exploitation in reinforcement learning, proving it is unavoidable in large policy sets, and establishes a theoretical bridge between reward hacking and model exploitation.

0 favorites 0 likes

safe-planning

DiRecT: Safe Diffusion-Based Planning via Receding-Horizon Denoising

Imperfect World Models are Exploitable

Submit Feedback