video-backbone

标签

Cards List
#video-backbone

Light-WAM:基于状态融合动作解码的高效世界动作模型

Hugging Face Daily Papers · 4天前 缓存

Light-WAM是一种轻量级世界动作模型,用于高效机器人操作。它采用紧凑视频骨干网络和降采样潜在空间进行未来视频监督,在保持低推理延迟的同时实现了高性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈