标签
来自xAI的Ethan He讨论了为什么视频代理模型是下一个前沿,他认为视频模型从LLM中获取智能,并且视频生成的演变将模仿AI编程,从一次性输出转向多轮规划与执行。
Latent Space 播客的一集讨论了这样一个论点:视频模型从大语言模型(LLM)中获取智能,下一个前沿是视频智能体。嘉宾 Ethan He(曾在 xAI 构建 Grok Imagine)分享了构建前沿图像和视频系统的见解。
一条推文称赞了一期播客,前xAI世界模型负责人Ethan He深入分享了训练SOTA视频生成世界模型的见解,涵盖了Grok Imagine、Cosmos,以及视频与编码代理之间的相似之处。
这篇文章批评 Arena.ai 涉嫌运行不诚实的基准测试,声称其将 GPT 5.5 在编程能力上排在 Meta 的 Muse Spark 之下,并将 Grok Imagine 在视频生成方面排在 Seedance 之上,作者断言这是客观错误的。
Ethan He, former head of world model at xAI and key contributor to Grok Imagine video generation, announced his departure. He built the multimodal video model from scratch in three months after joining xAI in July 2025.