instruction-generalization

#instruction-generalization

APT: Action Expert Pretraining Improves Instruction Generalization of Vision-Language-Action Policies

Hugging Face Daily Papers ↗ · 2026-06-10 Cached

Researchers propose APT, a two-stage training method that pretrains action experts on vision-action pairs before integrating language conditioning, significantly improving out-of-distribution instruction generalization for Vision-Language-Action policies.

0 favorites 0 likes

instruction-generalization

APT: Action Expert Pretraining Improves Instruction Generalization of Vision-Language-Action Policies

Submit Feedback