标签
来自xAI的Ethan He讨论了为什么视频代理模型是下一个前沿,他认为视频模型从LLM中获取智能,并且视频生成的演变将模仿AI编程,从一次性输出转向多轮规划与执行。
Google 发布了 Veo 3 和 Imagen 4,这是下一代视频和图像生成模型,具有显著的能力提升,包括音频生成和增强的物理模拟。该公司还推出了 AI 电影制作工具 Flow,并扩大了 Lyria 2 音乐创作工具的访问权限。
文章介绍了Google I/O 2026 Keynote上发布的生成式媒体产品更新,包括Google Pics图像编辑工具、Stitch UI设计工具,以及Google Flow的新功能如Gemini Omni、多智能体并行处理、自定义工具和音乐混音。强调技术帮助用户将创意快速变为现实。