Higgsfield 推出了他们所称的首个完全自动化 AI 视频代理——是真正的变革还是又一次炒作?

Reddit r/AI_Agents 产品

摘要

Higgsfield 推出了 Supercomputer,被描述为首个用于端到端视频创作的完全自动化 AI 代理,能够通过单一聊天界面规划、生成和发布长达数分钟的视频,但目前存在一些漏洞,长输出中连贯性有问题。

Higgsfield 于昨日(5月14日)发布了 Supercomputer。它被宣传为一个可以端到端运行研究、规划、生成和分发长达几分钟内容的聊天界面,用户只需批准他想要的内容。我用了一晚上进行测试。 **宣传内容:** 该代理会规划你要求做的任何事情(无论是电影预告片还是短视频),从路由层选择模型(Claude Opus 4.7, Veo 3.1, Kling, Seedance, Nano Banana),执行并发布。 记忆会作为视觉图谱跨会话持久化。30 多个连接器(Slack, Drive, Notion, Gmail, Figma)。通过 CronJobs 安排任务。最多支持 10 个并行聊天。 **最令人惊讶的部分:** 它能自动将片段拼接成超过 15 秒的视频,有时甚至长达几分钟。我测试过的其他所有代理都在生成交接时失败,或者最多只能输出单个片段。Higgsfield 声称使用这套技术栈在 96 小时内制作了一个 23 分钟的试播片,这与我看到的较短测试结果一致。 **不足之处:** 存在漏洞。刚刚发布,所以可能会遇到聊天挂起和积分计算不一致的问题。长格式输出有时会陷入 AI 垃圾内容,当超过 60 秒时,模型连贯性下降,片段之间会出现明显的漂移。我得到的结果有好有坏。 **为什么这可能会真的重要:** 到目前为止,所有的 AI 代理都局限于文本和代码领域,比如 Claude, ChatGPT, Cursor, Manus, Operator,它们研究、编写代码、点击浏览器、填写电子表格。没有一个涉及生成式内容。当你需要视频时,你打开 Sora, Kling 或 Higgsfield UI,手动生成、下载、编辑。无论这是否是正确的执行方式,这是创意制作首次拥有自己的代理类别。有没有其他人测试过或有意见?好奇大家在多分钟输出上得到了什么结果。
查看原文

相似文章

Higgsfield超级计算机

Product Hunt

Higgsfield超级计算机允许用户通过单一聊天代理管理整个创意流程。

Higgsfield 如何将简单创意转化为电影级社交视频

OpenAI Blog

# Higgsfield 如何将简单创意转化为电影级社交视频 来源:[https://openai.com/index/higgsfield/](https://openai.com/index/higgsfield/) 短视频驱动着现代商业,但要制作出真正有影响力的视频却比看起来更难。那些在 TikTok、Reels 和 Shorts 上看似毫不费力的片段,实则建立在一些无形的规则之上:钩子时机、镜头节奏、摄影机运动、节奏控制以及其他微妙的线索,它们让内容对当下流行的事物显得“原生”。[Higgsfield⁠\\(打开