标签
aronprins 宣布对 Claude Loop 和 Codex Loop 进行更新,增加了并行波次支持,以使用 Claude Code 实现更快速的自主编码工作流。
本文介绍了从传统提示词工程到“循环工程”的转变,开发者不再手动提示AI,而是让AI通过循环自动执行任务。文章详细解析了循环系统的核心组件、自动化带来的债务,并提供了两种实践方法。
一个使用300亿参数模型的AI智能体利用无头截图循环,自主完成了一个用C语言编写的光线追踪第一人称射击演示,展示了先进的自主编程和调试能力。
Anthropic工程师解释了如何在循环中使用Claude Code自主编写代码并管理PR,让开发者彻底远离键盘。
Factory 发布 Factory 2.0,从编码代理演变为端到端、代理原生软件工厂,实现组织范围内的自主软件开发,具有模型独立性和自主智能。
自主编码正在从优化提示词转向完善控制系统,工程师将AI代理嵌入目标设定、评估器和循环机制中。
Claude Fable 5 是 Anthropic 旗下 Mythos 类模型中的首个模型,现已全面登陆 GitHub Copilot。它专为长周期、自主编程及知识工作任务而设计,相比之前的 Opus 层级模型效率更高。
讨论了在自主AI编码代理工作流中人类审查的最佳位置,考虑了自动化与安全性之间的权衡,特别是针对认证、支付和数据库迁移等风险较高的系统。
Cursor的AI工程主管分享了一个14分钟的免费资源,讲解如何构建能交付生产代码的自主编码智能体,揭示了那些1000美元的vibe-coding课程无法教授的架构洞见。
gnhf 是一个开源工具,让你在睡觉时让AI代理自动循环修改代码、生成Git提交、处理错误并记录进展,支持多种AI模型(如Claude Code、Codex)和多代理并行工作。
一位开发者介绍了 Lauren,这是一个开源工具,能让智能体循环在运行期间动态编辑,允许用户在不停循环的情况下添加、优化或合并任务。
Anthropic工程师公开了长时AI智能体的开发经验,包括多角色分工、独立评估器等方法,使AI能在3-5小时内自动生成完整应用,连续运行能力提升12倍。
这篇文章提供了为 Claude Code、Codex、Hermes 等 AI 编码智能体编写有效 /goal 声明的最佳实践,强调目标应描述评估者能够验证的可观察结束状态。
解释了Claude Code的/goal命令如何通过模型验证的退出条件实现自主多轮任务完成,在大规模重构或功能实现过程中显著减少手动输入'继续'提示的需求。
小米已开源其 MiMo V2.5 Pro 模型,这是一个拥有 1020 亿参数、专为自主编码任务设计的混合专家(MoE)模型。本文详细介绍了一项现实世界中的测试,结果表明该模型凭借高缓存命中率实现了高效运行且 API 调用成本极低。
来自 Cognition 的自主编程智能体 Devin 在短短几个月内 ARR 从 100 万美元飙升至 4.45 亿美元,使用量每八周翻一番,客户涵盖 US Army 和 Goldman Sachs 等大型机构。Cognition 正以 250 亿美元估值进行融资,并于近期收购了 Windsurf;此前 Google 曾支付 24 亿美元授权费以引入 Windsurf 的创始团队。
作者构建了一个基准测试框架,用于评估本地LLM在自动生成Go代码方面的能力,重点聚焦SIEM流水线的日志解析器生成,并发布了对比质量与速度的测试结果。
Reddit 用户称 Qwen 3.6-27B 表现出罕见的主动行为,无需提示就自主编写、测试并修复代码。
Google 在 I/O 2026 上发布了智能体优先的桌面平台 Antigravity 2.0,集成 Gemini 3.5 Flash,能自主驱动 93 个子智能体在 12 小时内从零构建一个完整的操作系统,极大压缩了复杂工程任务的时间。