world-modeling

#world-modeling

@bageldotcom：我们正在发布WorldDiT，一个用于机器人世界建模与控制的统一架构。在LIBERO基准测试中，它……

X AI KOLs Following ↗ · 3天前缓存

WorldDiT是一个用于机器人世界建模与控制的统一架构，在不依赖VLM生成动作的方法中，它在LIBERO基准测试上取得了最佳性能，并位于所报告的帕累托前沿上。

0 人收藏 0 人点赞

#world-modeling

WorldDiT：统一的世界与动作建模扩散架构

Hugging Face Daily Papers ↗ · 4天前缓存

WorldDiT是一种统一的扩散变换器架构，它将动作生成与视觉世界建模相结合，在LIBERO仿真套件上取得了强劲性能，且无需依赖大型预训练视觉语言模型。

0 人收藏 0 人点赞

#world-modeling

@reza_byt: 世界建模借助JEPA最近因一种名为"SIGReg"的新型抗坍缩机制而获得关注（作者：@yl…

X AI KOLs Following ↗ · 2026-07-23 缓存

解释了SIGReg，一种针对JEPA的新型正则化器，通过迫使嵌入遵循各向同性高斯分布来防止表征坍缩，具有理论保证和简洁的训练循环。

0 人收藏 0 人点赞

#world-modeling

Masked Visual Actions：统一世界建模

Hugging Face Daily Papers ↗ · 2026-07-21 缓存

介绍了Masked Visual Actions，一种像素空间控制接口，将动作表示为部分揭示的轨迹，使得单个模型能够充当前向动力学模型、恢复机器人行为，并仅用15小时的训练数据支持基于模型的规划和逆向建模。

0 人收藏 0 人点赞

#world-modeling

AlayaWorld: 交互式长视界世界建模 -- 完整技术报告

Hugging Face Daily Papers ↗ · 2026-07-20 缓存

AlayaWorld是一个150亿参数的交互式视频世界模型，可生成24帧/秒的540p和720p视频，采用自回归潜变量块生成、受限视觉上下文以及蒸馏技术来减少推理步骤。它在长视界生成基准iWorld-Bench上达到了最先进的性能。

0 人收藏 0 人点赞

#world-modeling

无限世界与多样交互

Hugging Face Daily Papers ↗ · 2026-07-08 缓存

本文介绍了LingBot-World 2.0，一个先进的世界建模系统，具有无界交互范围、实时720p 60fps视频生成、多样化的交互元素（例如攻击、施法），以及通过领航员和导演智能体实现的新型多智能体行为控制，还附带一个共享的多玩家界面。

0 人收藏 0 人点赞

#world-modeling

OPINE-World: 使用本体错误优先的交互式探索进行程序化世界建模

arXiv cs.AI ↗ · 2026-07-03 缓存

OPINE-World 引入了一个 LLM 智能体，通过交互在线学习以对象为中心的程序化世界模型，采用本体错误优先的探索和协作的假设-测试智能体，在 ARC-AGI-3 上取得了强劲的结果。

0 人收藏 0 人点赞

#world-modeling

AGI Maze 作为世界建模智能体的基准框架

arXiv cs.AI ↗ · 2026-07-02 缓存

本文提出了AGI Maze，一个旨在评估AI智能体世界建模能力的基准框架。

0 人收藏 0 人点赞

#world-modeling

从动作到世界建模的可迁移动态先验学习

Hugging Face Daily Papers ↗ · 2026-06-28 缓存

本文介绍了A2World，一种基于扩散的世界模型，在大规模机器人操作数据上预训练，以学习可迁移的动态先验。该模型可适配为真实世界模拟器（A2World-sim）用于策略评估，或视频-动作联合预测模型（A2World-policy）用于动作预测，展示了在模拟器中心和策略中心的机器人学习中的优势。

0 人收藏 0 人点赞

#world-modeling

超越下一观测预测：面向顺序决策的智能体自主世界建模

arXiv cs.CL ↗ · 2026-06-25 缓存

本文提出了一种名为“智能体自主世界建模”（AAWM）的训练流程，该流程基于策略自身的决策需求构建世界模型监督，而非依赖下一观测预测，从而使学习目标与有效决策所需的动态特性对齐。

0 人收藏 0 人点赞

#world-modeling

MemoBench：动态变化环境中世界建模的基准测试

Hugging Face Daily Papers ↗ · 2026-06-25 缓存

MemoBench是一个诊断基准，用于评估视频生成模型在动态变化环境中的记忆一致性，其中物体消失并以更新后的状态重新出现。它包括360个真实视频片段和一个结合自动指标与基于VQA评估的测试套件，揭示了记忆一致性挑战的洞见。

0 人收藏 0 人点赞

#world-modeling

面向机器人控制的上下文世界建模

Hugging Face Daily Papers ↗ · 2026-06-25 缓存

本文介绍了上下文世界建模（ICWM），这是一个使机器人策略能够从自身生成的交互中推断系统变量的框架，通过将系统识别视为一个上下文自适应问题，无需参数更新即可适应新的配置。在模拟和真实世界实验中，它在处理新的相机视角时优于标准的VLA基线。

0 人收藏 0 人点赞

#world-modeling

AI现在能进行世界建模，从Anthropic Fable对峙实验可见

Reddit r/artificial ↗ · 2026-06-21

Anthropic证明，AI系统现在能够进行世界建模，Fable对峙实验即是证据。

0 人收藏 0 人点赞

#world-modeling

@cwolferesearch: 我最近读了很多关于智能体强化学习的论文。在所有工作中，唯一常用的技巧之一是动作……

X AI KOLs Timeline ↗ · 2026-06-19 缓存

讨论最近的智能体强化学习论文，强调动作掩码作为一种常见技术及其随着世界建模论文（如ECHO和PaW）的演变。

0 人收藏 0 人点赞

#world-modeling

@seclink: https://x.com/seclink/status/2067970118873993482

X AI KOLs Following ↗ · 2026-06-19 缓存

当前主流纯数据驱动机器人方案存在数据效率低、泛化性差的缺陷，新提出的神经符号物理智能范式将任务拆分为世界建模和规划两步，仅需1-10个演示即可学会新任务，泛化能力远超传统端到端方案，为通用机器人提供了更可靠的路径。

0 人收藏 0 人点赞

#world-modeling

@KempeLab: 我很激动地分享，我将加入@amilabs，担任巴黎的研究总监，与@ylecun和一支杰出的…

X AI KOLs Following ↗ · 2026-06-18 缓存

一位AI研究人员宣布加入AmiLabs，担任巴黎的研究总监，与Yann LeCun及一个专注于世界建模和基础模型的团队合作。

0 人收藏 0 人点赞

#world-modeling

@samsja19: 非常激动人心的工作，旨在弥合强化学习与中期/预训练之间的差距。你可以从环境中学习，超越奖励信号……

X AI KOLs Following ↗ · 2026-06-10 缓存

一种名为ECHO的新方法通过在使用工具调用输出上进行下一个词预测，从环境中学习超越奖励信号，将世界建模与代理行为相结合，从而弥合了强化学习与预训练之间的差距。

0 人收藏 0 人点赞

#world-modeling

语言代理的策略与世界模型协同训练

Hugging Face Daily Papers ↗ · 2026-06-01 缓存

本文介绍PaW，一种协同训练框架，在在线策略强化学习（on-policy RL）轨迹中向策略学习添加辅助世界模型监督，无需额外计算开销即可改进语言代理的训练。

0 人收藏 0 人点赞

world-modeling

提交意见反馈