world-models

#world-models

@rohanpaul_ai: 新微软论文认为，Transformer在学会紧凑内部状态时泛化更好，而不仅仅是预测下一个token……

X AI KOLs Timeline ↗ · 20小时前缓存

微软的NextLat论文提出了一种自监督训练方法，让Transformer预测其下一个隐藏状态而非仅仅下一个token，从而形成更紧凑的世界模型，更好地进行规划和推理，并且生成速度提升高达3.3倍。

0 人收藏 0 人点赞

#world-models

Qwen-AgentWorld: 通用智能体的语言世界模型

Hacker News Top ↗ · 21小时前缓存

Qwen-AgentWorld 引入了适用于智能体环境的语言世界模型，涵盖七个领域，并具备长链思维推理能力。该工作包含一个新基准 AgentWorldBench，并且表明世界建模能够提升下游智能体的性能。

0 人收藏 0 人点赞

#world-models

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069424192274252094

X AI KOLs Timeline ↗ · 昨天缓存

微软的NextLat引入了一种训练目标，它奖励信念状态表示，而不是仅仅依赖于下一个词预测，从而推动模型向紧凑的世界模型发展，以实现更好的泛化。

0 人收藏 0 人点赞

#world-models

@garridoq_: 在FAIR度过4.5年成长时光后，我激动地加入AMI Labs担任技术职员！我期待…

X AI KOLs Timeline ↗ · 2天前缓存

在FAIR工作4.5年后，一名研究员加入AMI Labs，致力于JEPA和World Models的研究。

0 人收藏 0 人点赞

#world-models

@rohanpaul_ai: LLM 代理能否通过交互发现隐藏规则？答案令人不安。隐藏世界越复杂…

X AI KOLs Following ↗ · 2天前缓存

本文研究了LLM代理是否可以通过交互推断隐藏的世界模型，发现随着复杂性的增加，它们难以构建稳定的内部模型。

0 人收藏 0 人点赞

#world-models

奖励作为具身世界模型的智能体

arXiv cs.AI ↗ · 4天前缓存

本文介绍了奖励作为智能体（Reward as an Agent）和DynDiff-GRPO，以解决具身世界模型中强化学习的奖励黑客攻击和有限探索问题，实现了显著的准确率提升。

0 人收藏 0 人点赞

#world-models

@gkxspace: LLM 大概率只是 AI 大模型的第一站。黄碧薇教授把 AI 范式分成四代：第一代（90年代）：小模型学相关性第二代（2010年）：小模型学因果第三代（现在LLM）：大模型学相关性第四代（下一步）：大模型学因果 30年，模型从小…

X AI KOLs Timeline ↗ · 6天前缓存

黄碧薇教授提出AI范式四代论，认为LLM只是第一站，未来是因果世界模型。Aether AI完成2000万美元融资，致力于构建因果世界模型。

0 人收藏 0 人点赞

#world-models

当前世界模型缺乏持久状态核心

Hugging Face Daily Papers ↗ · 6天前缓存

本文认为当前世界模型缺乏持久状态核心，提出一种混合方法，通过η-伪酉算子动力学添加时间因果结构，将预训练的GPT-2转化为时间推理模型。

0 人收藏 0 人点赞

#world-models

林俊阳AI实验室以20亿美元估值完成融资轮次

Reddit r/LocalLLaMA ↗ · 2026-06-17 缓存

前阿里巴巴千问团队负责人林俊阳的AI实验室完成首轮融资，投后估值达20亿美元。高榕资本和红杉中国各投资1亿美元，腾讯追加2000万美元。该实验室将专注于世界模型和具身智能，而非通用大语言模型。

0 人收藏 0 人点赞

#world-models

@odysseyml: 我们已筹集3.1亿美元B轮融资，加速世界模型的发展！我们相信能够理解和模拟世界的AI将成为…

X AI KOLs Following ↗ · 2026-06-17 缓存

OdysseyML宣布完成3.1亿美元B轮融资，用于推进世界模型的发展，投资方包括Natural Capital、Amazon、GV、AMD和IQT。

0 人收藏 0 人点赞

#world-models

下一代潜在预测变换器 [R]

Reddit r/MachineLearning ↗ · 2026-06-17

微软研究院提出Next-Latent Prediction (NextLat)方法，一种自监督学习方法，训练变换器预测自身下一个潜在状态，从而形成用于推理和规划的紧凑世界模型，并通过自推测解码实现高达3.3倍的推理加速。

0 人收藏 0 人点赞

#world-models

@rohanpaul_ai: 语言有一个机器人不具备的奇怪优势：文本已经是人类思想的压缩共享界面，而…

X AI KOLs Following ↗ · 2026-06-16 缓存

讨论了具身AI和机器人技术面临的挑战，包括10万年的数据差距以及缺乏共享基准，并强调了数据循环、评估系统和部署方面的创业机会。

0 人收藏 0 人点赞

#world-models

@dair_ai: 一个LLM代理真的能构建它无法看到的环境模型吗？这项工作使这个问题可评分。一个代理…

X AI KOLs Following ↗ · 2026-06-16 缓存

一篇研究论文提出了‘智能体自动机学习’来评估LLM代理是否能通过交互推断隐藏的世界模型，发现性能随着任务复杂度的增加而急剧下降，并且推理模型优于非推理模型，但仍然存在困难。

0 人收藏 0 人点赞

#world-models

世界模型应如何评估？一种以决策为中心的立场

arXiv cs.LG ↗ · 2026-06-16 缓存

本文调研了世界模型的评估方法，主张采用以决策为中心的框架，优先考虑反事实推理、规划与策略优化，而非视觉质量。文中引入了L0–L7评估阶梯及基准协议，使评估与声称的效用一致。

0 人收藏 0 人点赞

#world-models

@DengHokin: 我非常兴奋地宣布，我发起了一个每周视频模型期刊俱乐部。每周我们会挑选一篇论文进行深入探讨，……

X AI KOLs Timeline ↗ · 2026-06-16 缓存

作者发起了一个每周视频模型期刊俱乐部，涵盖视频生成、世界模型、物理推理、扩散模型、流匹配等。首次线下讲座将由 Yilun Du 主讲，主题为“基于世界模型的具身推理”。

0 人收藏 0 人点赞

#world-models

Kairos: 面向物理AI的原生世界模型栈

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

Kairos是一个面向物理AI的原生世界模型框架，它通过跨具身数据课程从多样化的经验中学习，利用混合时序注意力维持持久状态，并支持在服务器和消费级硬件上高效部署。

0 人收藏 0 人点赞

#world-models

EgoCS-400K：一个面向世界模型的第一人称游戏数据集

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

EgoCS-400K 是一个大规模的第一人称反恐精英数据集，包含超过40万段第一人称视频和10,000小时的游戏玩法，为世界模型研究提供了时间对齐的视频-动作-语言轨迹。

0 人收藏 0 人点赞

#world-models

Looped World Models

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

Looped World Models 通过共享的Transformer块引入迭代潜在状态细化，实现了100倍的参数效率，同时根据预测复杂度自适应调整计算深度。

0 人收藏 0 人点赞

#world-models

用于 Monte Carlo Tree Search 规划的因果对象中心模型

arXiv cs.AI ↗ · 2026-06-15 缓存

COMET 是一种基于模型的强化学习算法，结合了冻结的对象中心编码器、基于 Transformer 的世界模型和 Monte Carlo Tree Search，通过因果注意力聚焦于任务相关对象，在视觉强化学习基准上取得了更高分数。

0 人收藏 0 人点赞

#world-models

BadWorld：对世界模型的对抗性攻击

Hugging Face Daily Papers ↗ · 2026-06-15 缓存

BadWorld是一种无标签的对抗框架，通过生成不可察觉的扰动来揭示视觉世界模型中的结构漏洞，这些扰动会导致未来展开中的灾难性失败。

0 人收藏 0 人点赞

world-models

提交意见反馈