stable-worldmodel-v1：可复现的世界建模研究与评估

Papers with Code Trending 2026/02/09 18:04 论文

world-models reproducible-research reinforcement-learning robustness continual-learning framework open-source

摘要

Stable-Worldmodel (SWM) 是一个模块化、标准化的研究框架，用于开发和评估世界模型，旨在提高可复现性并支持鲁棒性和持续学习研究。

世界模型作为一种强大的范式，用于学习环境动态的紧凑预测表示，使智能体能够超越直接经验进行推理、规划和泛化。尽管最近人们对世界模型产生了兴趣，但大多数可用的实现仍然局限于特定出版物，严重限制了其可重用性，增加了漏洞风险，并降低了评估标准化。为了缓解这些问题，我们引入了 stable-worldmodel (SWM)，这是一个模块化、经过测试且有文档记录的世界模型研究生态系统，提供高效的数据收集工具、标准化环境、规划算法和基线实现。此外，SWM 中的每个环境都支持可控的变化因素（包括视觉和物理属性），以支持鲁棒性和持续学习研究。最后，我们通过使用 SWM 研究 DINO-WM 中的零样本鲁棒性，展示了其效用。

查看原文

查看缓存全文

缓存时间: 2026/05/29 06:47

论文页面 - stable-worldmodel-v1：可复现的世界模型研究与评估

来源: https://huggingface.co/papers/2602.08968

摘要

Stable-worldmodel 提供了一个模块化、标准化的研究框架，用于开发与评估世界模型，支持可控环境因素，适用于鲁棒性和持续学习应用。

世界模型（World Models (https://huggingface.co/papers?q=World%20Models)）已成为一种强大范式，用于学习紧凑的预测表示（predictive representations (https://huggingface.co/papers?q=predictive%20representations)）以刻画环境动态（environment dynamics (https://huggingface.co/papers?q=environment%20dynamics)），使智能体能够超越直接经验进行推理、规划和泛化。尽管近期人们对世界模型（World Models (https://huggingface.co/papers?q=World%20Models)）兴趣浓厚，但大多数现有实现仍局限于特定论文，严重限制了可复用性，增加了引入错误的风险，并降低了评估标准化程度。为解决这些问题，我们推出了 stable-worldmodel（SWM），这是一个模块化、经过测试且文档完善的世界模型研究生态系统，提供高效的数据采集工具（data-collection tools (https://huggingface.co/papers?q=data-collection%20tools)）、标准化环境（standardized environments (https://huggingface.co/papers?q=standardized%20environments)）、规划算法（planning algorithms (https://huggingface.co/papers?q=planning%20algorithms)）以及基线实现（baseline implementations (https://huggingface.co/papers?q=baseline%20implementations)）。此外，SWM 中的每个环境都支持可控的变化因素（controllable factors of variation (https://huggingface.co/papers?q=controllable%20factors%20of%20variation)），包括视觉和物理属性，以支持鲁棒性（robustness (https://huggingface.co/papers?q=robustness)）和持续学习（continual learning (https://huggingface.co/papers?q=continual%20learning)）研究。最后，我们通过 SWM 研究了 DINO-WM（DINO-WM (https://huggingface.co/papers?q=DINO-WM)）的零样本鲁棒性（zero-shot robustness (https://huggingface.co/papers?q=zero-shot%20robustness)），展示了其实用性。

查看 arXiv 页面 (https://arxiv.org/abs/2602.08968)查看 PDF (https://arxiv.org/pdf/2602.08968)项目页面 (https://galilai-group.github.io/stable-worldmodel/)GitHub 881 (https://github.com/galilai-group/stable-worldmodel)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2602.08968)

在您的代理中获取本文：

hf papers read 2602\.08968

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本文的模型 (2)

zzsi/swm-dmc-cheetah (https://huggingface.co/zzsi/swm-dmc-cheetah)

zzsi/swm-dmc-expert-policies 强化学习 • 更新于 2 月 26 日 (https://huggingface.co/zzsi/swm-dmc-expert-policies)

引用本文的数据集 (3)

zzsi/swm-dmc-expert (https://huggingface.co/datasets/zzsi/swm-dmc-expert)

zzsi/swm-dmc-mixed-small (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-small)

zzsi/swm-dmc-mixed-large (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-large)

引用本文的空间 (0)

未关联本文的空间

若要将其从此页面链接，请在 Space 的 README.md 中引用 arxiv.org/abs/2602.08968。

包含本文的收藏集 (0)

未包含本文的收藏集

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。

stable-worldmodel-v1：可复现的世界建模研究与评估

论文页面 - stable-worldmodel-v1：可复现的世界模型研究与评估

摘要

引用本文的模型 (2)

zzsi/swm-dmc-cheetah (https://huggingface.co/zzsi/swm-dmc-cheetah)

zzsi/swm-dmc-expert-policies 强化学习 • 更新于 2 月 26 日 (https://huggingface.co/zzsi/swm-dmc-expert-policies)

引用本文的数据集 (3)

zzsi/swm-dmc-expert (https://huggingface.co/datasets/zzsi/swm-dmc-expert)

zzsi/swm-dmc-mixed-small (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-small)

zzsi/swm-dmc-mixed-large (https://huggingface.co/datasets/zzsi/swm-dmc-mixed-large)

引用本文的空间 (0)

包含本文的收藏集 (0)

相似文章

galilai-group/stable-worldmodel

GigaWorld-1: 构建用于机器人策略评估的世界模型路线图

Micro-World - 动作控制的交互世界模型 - AMD

minWM：用于实时交互式视频世界模型的全栈开源框架

世界模型应如何评估？一种以决策为中心的立场

提交意见反馈