标签
视觉AI领域发生重大转变,顶级工具不再直接生成最终输出,而是生成其背后的源代码,a16z合伙人Yoko Li对此进行了深入分析。
文章认为,视觉AI的下一个前沿是生成代码(例如SVG、HTML/CSS、React组件),而非原始像素,从而实现了可编辑性、迭代性以及与专业设计和开发工作流程的集成。
马丁·斯科塞斯加入 Black Forest Labs 担任顾问,并使用 FLUX 进行故事板制作,展示了 AI 在视觉创意中的作用。
EyeBench-V3 视觉基准测试评估了 Claude Opus 4.8,发现它仍然无法完成基本视觉任务,这与 IBench 类似。该基准测试是通过 Adonis Singh 的 Twitter 帖子介绍的。
OpenAI 发布 ChatGPT Images 2.0,号称实现 GPT-3 到 GPT-5 的飞跃;Simon Willison 用“找浣熊+火腿电台”的 Where’s Waldo 式提示词,把它与 gpt-image-1、Google Nano Banana 2 和 Pro 对比测试,捉迷藏成功率参差不齐。
开启“思考”模式的 ChatGPT Images 2.0,能把 1,000 字提示或 70 页 PDF 直接变成可立即使用的信息图、幻灯片及学术海报,无需手动调整。