world-models

标签

Cards List
#world-models

@rohanpaul_ai: 新微软论文认为,Transformer在学会紧凑内部状态时泛化更好,而不仅仅是预测下一个token……

X AI KOLs Timeline · 20小时前 缓存

微软的NextLat论文提出了一种自监督训练方法,让Transformer预测其下一个隐藏状态而非仅仅下一个token,从而形成更紧凑的世界模型,更好地进行规划和推理,并且生成速度提升高达3.3倍。

0 人收藏 0 人点赞
#world-models

Qwen-AgentWorld: 通用智能体的语言世界模型

Hacker News Top · 21小时前 缓存

Qwen-AgentWorld 引入了适用于智能体环境的语言世界模型,涵盖七个领域,并具备长链思维推理能力。该工作包含一个新基准 AgentWorldBench,并且表明世界建模能够提升下游智能体的性能。

0 人收藏 0 人点赞
#world-models

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069424192274252094

X AI KOLs Timeline · 昨天 缓存

微软的NextLat引入了一种训练目标,它奖励信念状态表示,而不是仅仅依赖于下一个词预测,从而推动模型向紧凑的世界模型发展,以实现更好的泛化。

0 人收藏 0 人点赞
#world-models

@garridoq_: 在FAIR度过4.5年成长时光后,我激动地加入AMI Labs担任技术职员!我期待…

X AI KOLs Timeline · 2天前 缓存

在FAIR工作4.5年后,一名研究员加入AMI Labs,致力于JEPA和World Models的研究。

0 人收藏 0 人点赞
#world-models

@rohanpaul_ai: LLM 代理能否通过交互发现隐藏规则?答案令人不安。隐藏世界越复杂…

X AI KOLs Following · 2天前 缓存

本文研究了LLM代理是否可以通过交互推断隐藏的世界模型,发现随着复杂性的增加,它们难以构建稳定的内部模型。

0 人收藏 0 人点赞
#world-models

奖励作为具身世界模型的智能体

arXiv cs.AI · 4天前 缓存

本文介绍了奖励作为智能体(Reward as an Agent)和DynDiff-GRPO,以解决具身世界模型中强化学习的奖励黑客攻击和有限探索问题,实现了显著的准确率提升。

0 人收藏 0 人点赞
#world-models

@gkxspace: LLM 大概率只是 AI 大模型的第一站。 黄碧薇教授把 AI 范式分成四代: 第一代(90年代):小模型学相关性 第二代(2010年):小模型学因果 第三代(现在LLM):大模型学相关性 第四代(下一步):大模型学因果 30年,模型从小…

X AI KOLs Timeline · 6天前 缓存

黄碧薇教授提出AI范式四代论,认为LLM只是第一站,未来是因果世界模型。Aether AI完成2000万美元融资,致力于构建因果世界模型。

0 人收藏 0 人点赞
#world-models

当前世界模型缺乏持久状态核心

Hugging Face Daily Papers · 6天前 缓存

本文认为当前世界模型缺乏持久状态核心,提出一种混合方法,通过η-伪酉算子动力学添加时间因果结构,将预训练的GPT-2转化为时间推理模型。

0 人收藏 0 人点赞
#world-models

林俊阳AI实验室以20亿美元估值完成融资轮次

Reddit r/LocalLLaMA · 2026-06-17 缓存

前阿里巴巴千问团队负责人林俊阳的AI实验室完成首轮融资,投后估值达20亿美元。高榕资本和红杉中国各投资1亿美元,腾讯追加2000万美元。该实验室将专注于世界模型和具身智能,而非通用大语言模型。

0 人收藏 0 人点赞
#world-models

@odysseyml: 我们已筹集3.1亿美元B轮融资,加速世界模型的发展!我们相信能够理解和模拟世界的AI将成为…

X AI KOLs Following · 2026-06-17 缓存

OdysseyML宣布完成3.1亿美元B轮融资,用于推进世界模型的发展,投资方包括Natural Capital、Amazon、GV、AMD和IQT。

0 人收藏 0 人点赞
#world-models

下一代潜在预测变换器 [R]

Reddit r/MachineLearning · 2026-06-17

微软研究院提出Next-Latent Prediction (NextLat)方法,一种自监督学习方法,训练变换器预测自身下一个潜在状态,从而形成用于推理和规划的紧凑世界模型,并通过自推测解码实现高达3.3倍的推理加速。

0 人收藏 0 人点赞
#world-models

@rohanpaul_ai: 语言有一个机器人不具备的奇怪优势:文本已经是人类思想的压缩共享界面,而…

X AI KOLs Following · 2026-06-16 缓存

讨论了具身AI和机器人技术面临的挑战,包括10万年的数据差距以及缺乏共享基准,并强调了数据循环、评估系统和部署方面的创业机会。

0 人收藏 0 人点赞
#world-models

@dair_ai: 一个LLM代理真的能构建它无法看到的环境模型吗?这项工作使这个问题可评分。一个代理…

X AI KOLs Following · 2026-06-16 缓存

一篇研究论文提出了‘智能体自动机学习’来评估LLM代理是否能通过交互推断隐藏的世界模型,发现性能随着任务复杂度的增加而急剧下降,并且推理模型优于非推理模型,但仍然存在困难。

0 人收藏 0 人点赞
#world-models

世界模型应如何评估?一种以决策为中心的立场

arXiv cs.LG · 2026-06-16 缓存

本文调研了世界模型的评估方法,主张采用以决策为中心的框架,优先考虑反事实推理、规划与策略优化,而非视觉质量。文中引入了L0–L7评估阶梯及基准协议,使评估与声称的效用一致。

0 人收藏 0 人点赞
#world-models

@DengHokin: 我非常兴奋地宣布,我发起了一个每周视频模型期刊俱乐部。每周我们会挑选一篇论文进行深入探讨,……

X AI KOLs Timeline · 2026-06-16 缓存

作者发起了一个每周视频模型期刊俱乐部,涵盖视频生成、世界模型、物理推理、扩散模型、流匹配等。首次线下讲座将由 Yilun Du 主讲,主题为“基于世界模型的具身推理”。

0 人收藏 0 人点赞
#world-models

Kairos: 面向物理AI的原生世界模型栈

Hugging Face Daily Papers · 2026-06-16 缓存

Kairos是一个面向物理AI的原生世界模型框架,它通过跨具身数据课程从多样化的经验中学习,利用混合时序注意力维持持久状态,并支持在服务器和消费级硬件上高效部署。

0 人收藏 0 人点赞
#world-models

EgoCS-400K:一个面向世界模型的第一人称游戏数据集

Hugging Face Daily Papers · 2026-06-16 缓存

EgoCS-400K 是一个大规模的第一人称反恐精英数据集,包含超过40万段第一人称视频和10,000小时的游戏玩法,为世界模型研究提供了时间对齐的视频-动作-语言轨迹。

0 人收藏 0 人点赞
#world-models

Looped World Models

Hugging Face Daily Papers · 2026-06-16 缓存

Looped World Models 通过共享的Transformer块引入迭代潜在状态细化,实现了100倍的参数效率,同时根据预测复杂度自适应调整计算深度。

0 人收藏 0 人点赞
#world-models

用于 Monte Carlo Tree Search 规划的因果对象中心模型

arXiv cs.AI · 2026-06-15 缓存

COMET 是一种基于模型的强化学习算法,结合了冻结的对象中心编码器、基于 Transformer 的世界模型和 Monte Carlo Tree Search,通过因果注意力聚焦于任务相关对象,在视觉强化学习基准上取得了更高分数。

0 人收藏 0 人点赞
#world-models

BadWorld:对世界模型的对抗性攻击

Hugging Face Daily Papers · 2026-06-15 缓存

BadWorld是一种无标签的对抗框架,通过生成不可察觉的扰动来揭示视觉世界模型中的结构漏洞,这些扰动会导致未来展开中的灾难性失败。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈