@jholtdigital:最近有位朋友鼓励我,如果想了解某件事物对我的用例效果如何,就应该试用一个月……
摘要
一位用户分享了使用 FactoryAI 将设计系统从 HTML/CSS 转换为带有 E2E 测试的 Flutter 组件的体验。该工具使用编排器、工作者和验证器,结合多种 AI 模型来规划和执行长达 79 小时的长期任务,总共生成了超过 229 个代理。
查看缓存全文
缓存时间: 2026/06/23 21:54
最近有位朋友鼓励我,如果想了解某个工具是否适合自己的场景,不妨先试用一个月。于是我便用另一款一直想探索的AI工具尝试了一下。
我运行了首个 @FactoryAI 任务——这是 Factory/Droid 团队提出的一个非常酷的理念。他们为这种长周期任务构建的体系结构非常系统:由一个编排者进行规划、提出澄清性问题、创建里程碑、根据你的代码库限制制定计划,并执行长时间的工作。与我曾在其他应用中使用过的 /goal 命令相比,这个体系要严谨得多。
本次运行的一些数据:
- 活跃时长:79小时2分钟
- 每个里程碑平均耗时:5.3小时
- 每个功能平均耗时:30.2分钟
- 累计生成 229+ 个智能体——这还不包括它们所衍生的子智能体(用于审查代码在简洁性和架构匹配度等方面的子智能体)
- 共158个任务
这项具体任务是:将我之前用 HTML/CSS 设计并优化过的设计系统,转换为 Flutter 组件,并使用 Patrol 进行端到端测试。它替代了原有的基础 Material Design 主题和组件。在规划实现之前,智能体首先需要截取 HTML 原型的多张截图。编排者所创建的初始规划由 Fable 5 完成;但规划创建之后,编排者使用的模型要么是 Opus 4.8,更常见的是 GPT 5.5 xhigh。工作智能体使用 Composer 2.5、部分 GLM 5.2 以及一些 Kimi K2.6/K2.7。验证智能体几乎全部使用 GPT 5.5。
我从未见过这样的系统。它令人印象深刻。接下来几周我需要做大量优化。系统本身完整且运行良好,但有不少界面错误与原型并不完全一致。不过我认为无论使用什么工具,这种情况都难以避免。智能体可以完成大约80%的工作,而最后20%的优化才是重头戏。非常震撼!如果大家有兴趣了解更多细节,我或许可以写一篇更长的总结。
相似文章
@rohanpaul_ai: Factory 2.0 来了。将 AI 智能体连接到整个软件工作流程:工单、客户请求、代码、测试、安全……
Factory 2.0 将 AI 智能体连接到整个软件工作流程,管理从工单到事件的反馈循环,将每个信号都视为训练数据。
今年尝试了12+个自主AI工作流构建工具——这5个在实际生产中表现优异
对五个在生产中真正有效的自主AI工作流构建工具的评测,重点介绍SimplAI作为突出的企业智能体操作系统,并讨论工作流层比模型质量更重要的观点。
AI代理在重复工作上浪费代币。我构建了一个解决方案,需要测试者。
一位开发者构建了一个系统,通过跨任务复用信息来减少AI代理工作流中的代币浪费,现正在寻找测试者提供反馈。
@cryptopunk7213: 这真是天才。在AI模型越来越昂贵且日益丰富的世界里,这样的产品简直是梦想中的AI护城河……
Factory Router 为每个任务自动选择最佳AI模型,声称能在保持前沿性能的同时削减25%的成本,对大企业来说是一款前景广阔的工具。
@nikunj: 老兄,/goal 就是 AGI,如果有合适的工具的话…… 你说什么?你遍历了整个包含两千多个条目的数据库……
一位用户描述了一个AI代理,它自主修复了数据库中的产品图片、前端错误和描述,使用了浏览器自动化和网络搜索,并在用户与创始人会面的两小时内运行,突显了令人印象深刻的类似AGI的能力。