stable-worldmodel-v1:可复现的世界建模研究与评估
摘要
Stable-Worldmodel (SWM) 是一个模块化、标准化的研究框架,用于开发和评估世界模型,旨在提高可复现性并支持鲁棒性和持续学习研究。
查看缓存全文
缓存时间: 2026/05/29 06:47
论文页面 - stable-worldmodel-v1:可复现的世界模型研究与评估
来源: https://huggingface.co/papers/2602.08968
摘要
Stable-worldmodel 提供了一个模块化、标准化的研究框架,用于开发与评估世界模型,支持可控环境因素,适用于鲁棒性和持续学习应用。
世界模型(World Models (https://huggingface.co/papers?q=World%20Models))已成为一种强大范式,用于学习紧凑的预测表示(predictive representations (https://huggingface.co/papers?q=predictive%20representations))以刻画环境动态(environment dynamics (https://huggingface.co/papers?q=environment%20dynamics)),使智能体能够超越直接经验进行推理、规划和泛化。尽管近期人们对世界模型(World Models (https://huggingface.co/papers?q=World%20Models))兴趣浓厚,但大多数现有实现仍局限于特定论文,严重限制了可复用性,增加了引入错误的风险,并降低了评估标准化程度。为解决这些问题,我们推出了 stable-worldmodel(SWM),这是一个模块化、经过测试且文档完善的世界模型研究生态系统,提供高效的数据采集工具(data-collection tools (https://huggingface.co/papers?q=data-collection%20tools))、标准化环境(standardized environments (https://huggingface.co/papers?q=standardized%20environments))、规划算法(planning algorithms (https://huggingface.co/papers?q=planning%20algorithms))以及基线实现(baseline implementations (https://huggingface.co/papers?q=baseline%20implementations))。此外,SWM 中的每个环境都支持可控的变化因素(controllable factors of variation (https://huggingface.co/papers?q=controllable%20factors%20of%20variation)),包括视觉和物理属性,以支持鲁棒性(robustness (https://huggingface.co/papers?q=robustness))和持续学习(continual learning (https://huggingface.co/papers?q=continual%20learning))研究。最后,我们通过 SWM 研究了 DINO-WM(DINO-WM (https://huggingface.co/papers?q=DINO-WM))的零样本鲁棒性(zero-shot robustness (https://huggingface.co/papers?q=zero-shot%20robustness)),展示了其实用性。
查看 arXiv 页面 (https://arxiv.org/abs/2602.08968)查看 PDF (https://arxiv.org/pdf/2602.08968)项目页面 (https://galilai-group.github.io/stable-worldmodel/)GitHub 881 (https://github.com/galilai-group/stable-worldmodel)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2602.08968)
在您的代理中获取本文:
hf papers read 2602\.08968
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用本文的模型 (2)
zzsi/swm-dmc-cheetah (https://huggingface.co/zzsi/swm-dmc-cheetah)
zzsi/swm-dmc-expert-policies 强化学习 • 更新于 2 月 26 日 (https://huggingface.co/zzsi/swm-dmc-expert-policies)
引用本文的数据集 (3)
zzsi/swm-dmc-expert (https://huggingface.co/datasets/zzsi/swm-dmc-expert)
zzsi/swm-dmc-mixed-small (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-small)
zzsi/swm-dmc-mixed-large (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-large)
引用本文的空间 (0)
未关联本文的空间
若要将其从此页面链接,请在 Space 的 README.md 中引用 arxiv.org/abs/2602.08968。
包含本文的收藏集 (0)
未包含本文的收藏集
将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
galilai-group/stable-worldmodel
stable-worldmodel 是一个用于可重复世界模型研究的统一平台,提供标准化的环境、数据收集、训练和评估接口。
minWM:用于实时交互式视频世界模型的全栈开源框架
minWM 是一个全栈开源框架,可将双向视频扩散模型转换为实时交互式视频世界模型,支持可控相机、低延迟推演和模块化架构。
机器人学习中的世界模型:全面综述
本综述全面回顾了机器人学习中世界模型的文献,涵盖其在策略学习、规划和模拟中的作用。文章突出了预测建模在具身智能体中的关键范式、基准测试及未来发展方向。
SANA-WM: 高效分钟级世界建模与混合线性扩散Transformer
SANA-WM是一个拥有26亿参数的开源世界模型,能生成高保真720p分钟级视频,支持精确相机控制,在达到工业级质量的同时显著降低计算需求。
MultiWorld:可扩展的多智能体多视角视频世界模型
MultiWorld 是一个统一的多智能体多视角视频世界建模框架,通过多智能体条件模块与全局状态编码器,在精准控制多智能体行为的同时保持多视角一致性。