@EthanHe_42: 在@latentspacepod播客中,我分享了关于视频生成、世界模型、LLMs、智能体、持续学习以及……的观点

X AI KOLs Following 新闻

摘要

Ethan He在Latent Space播客中分享了他的见解,讨论了关于视频生成、世界模型、LLMs、智能体、持续学习以及AI下一前沿的关键观点。

在@latentspacepod播客中,我分享了关于视频生成、世界模型、LLMs、智能体、持续学习以及下一前沿在哪里的观点。 1. 视频模型的大部分智能来自语言,而非视频数据。 2. 从想法到代码现在很快。瓶颈又回到了拥有足够的算力来尝试每个想法。 3. 在模型开发中,迭代速度几乎胜过其他一切。 4. 下一个飞跃不会是更好的视频模型,而是一个视频智能体。 5. 扩散模型将成为AGI的前端,LLM作为后端。生成式UI将取代HTML/CSS:用户意图直接到像素。 6. 物理具身可能成为强大AI拾起的工具。机器人技术可能由具备视频能力的LLMs解决。 7. 持续学习可能看起来像模型管理自己的上下文,甚至在测试时重写自己的框架。 感谢@swyx和@vibhuuuus的邀请
查看原文
查看缓存全文

缓存时间: 2026/06/02 17:37

在 @latentspacepod 播客中,我分享了我对视频生成、世界模型、大语言模型(LLM)、智能体(agent)、持续学习以及下一个前沿领域的看法。

  1. 视频模型的智能主要来源于语言,而非视频数据。
  2. 从想法到代码现在很快。瓶颈又回到了是否有足够的算力去尝试每一个想法。
  3. 在模型开发中,迭代速度几乎胜过其他一切。
  4. 下一个飞跃不会是一个更好的视频模型,而是一个视频智能体。
  5. 扩散模型将成为 AGI 的前端,LLM 作为后端。生成式 UI 将取代 HTML/CSS:从用户意图直接到像素。
  6. 物理具身化可能成为强大 AI 使用的一种工具。机器人技术可能被能处理视频的 LLM 解决。
  7. 持续学习可能表现为模型管理自身的上下文,甚至在测试时重写自身的框架。

感谢 @swyx 和 @vibhuuuus 邀请我

Apple 播客:https://podcasts.apple.com/us/podcast/latent-space-the-ai-engineer-podcast/id1674008350?i=1000770600564… Spotify:https://open.spotify.com/episode/1ZUjJ0WBqpp5F2vwZbpVSf… Substack 上的文字稿:https://latent.space/p/video-agents

很棒的访谈 @EthanHe_42 @latentspacepod

听起来不错。好播客 @EthanHe_42

相似文章

@swyx: 完整文章和链接在此

X AI KOLs Timeline

Latent Space 播客的一集讨论了这样一个论点:视频模型从大语言模型(LLM)中获取智能,下一个前沿是视频智能体。嘉宾 Ethan He(曾在 xAI 构建 Grok Imagine)分享了构建前沿图像和视频系统的见解。