generative-policies

标签

Cards List
#generative-policies

WarmPrior: 利用时间先验拉直流匹配策略

arXiv cs.LG · 2026-05-15 缓存

介绍了WarmPrior,该方法将流匹配策略中的标准高斯源替换为来自近期动作历史的时间约束先验,通过生成更直的路径概率,持续提升机器人操控任务的成功率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈