标签
认为在AI时代,产品经理的关键技能是循环工程,而非提示工程。描述了如何为AI智能体创建可复用、自我改进的循环,以保持质量并避免漂移。
Maka 发布 Autonomous Task Loop v1,实现了 agent 的持久化循环:preflight → runtime → SelfCheck → FeedbackObservation → Decision,支持自我检查、预算控制和状态恢复,使 Maka 桌面 AI 工作台具备了运行持续任务的基础能力。
本文提出14步路线图,从单代理到自我进化系统,强调基座工程(模型、工具、权限、上下文)才是决定循环产出质量的关键,并详细介绍了CLAUDE.md、子代理、技能、钩子、状态文件等构建高效基座的实践方法。
一位开发者构建了 Theodosia,这是一个将状态机作为 MCP 适配器的工具,用于强制智能体工作流中的合法转换,防止错误的完成,并提供基于哈希链的步骤账本。
这篇帖子演示了如何通过单个提示词免费微调模型,利用了新的Google Colab CLI以及Hugging Face的TRL和trackio工具,所有这些都由AI代理编排。
Claude Code v2.1.172 新增子 Agent 嵌套能力,最多支持5层嵌套,允许下层 Agent 在遇到复杂子任务时自动生成孙 Agent 分工处理,并介绍了使用场景、配置方法和常见坑点。
一种观察:同一AI模型的两个实例在相同任务上可能产生不同的内部行为(例如,一个重构了共享工具而另一个没有),凸显了仅通过最终输出来审查智能体工作的挑战。
一个开源插件引入了一个审计优先的工作流程,用于AI编程代理将Web应用转换为原生移动应用,使用结构化的Markdown计划和审批关卡来避免过早编码。
介绍了一款用于可视化AI智能体工作流的工具,支持多种智能体框架,包括Langgraph、CrewAI、AutoGen、Google ADK和OpenAI Agents SDK。创作者正在寻求社区的反馈与修正。
Autocontext 是一个开源递归自我改进 harness,帮助 AI Agent 通过迭代执行、评估和知识积累持续优化,生成可复用的 playbook、数据集甚至本地模型,适合构建生产级 Agent 工作流的开发者。
MIT HAN Lab 提出了一种利用AI agent流程自动设计和优化CUDA kernel的方法,通过任务合约、agent循环和小步验证的工作流,使agent能在专业工具链中自主迭代优化,替代手工调优。
SkillHarm 是一个用于评估技能使用生命周期中基于技能的攻击的基准,揭示了当前AI代理的高度脆弱性(攻击成功率高达86.3%),并引入了通过AutoSkillHarm实现的自动化攻击构建。
本文重点讨论了随时间推移管理 AI 智能体记忆时日益严重的问题:用户花费更多精力维护上下文,而非实际使用智能体。文章指出,目前缺乏用于记忆衰减和治理的基础设施。
对llama.cpp的b9200更新进行基准测试,使用优化标志在单张RTX 3090上运行Qwen 3.6 27B MTP,结果显示在代理工作流的提示处理速度方面有显著性能提升。
本文介绍了如何通过Cron、Gateway和Heartbeat机制让Hermes Agent实现24小时持续工作,关键在于使用状态文件而非聊天上下文来维持连续性。
一个新的开源项目介绍了一个自托管的、语音优先的 macOS 多智能体编排系统,该系统使用 Claude Code 作为执行运行器。其设置采用新颖的父子结构,并带有一个看门狗层,以防止智能体之间的无尽审查循环。
Matt Pocock 分享了一个利用 Claude Code 的 /grill-with-docs 和 /prototype 命令的工作流,用于迭代 UI 设计,并在继续之前总结从原型开发中学到的经验。
一款专为 Claude Code 设计的全新开源 10 阶段 AI 研究系统插件,自动化了文献综述、引用验证和同行评审模拟。它通过事实核查和模拟批判性反馈,声称能够以极低的成本生成高质量的学术初稿。
介绍 Garry Tan 的 'Plan-Eng-Review' 技能,强调在使用 AI 编程前应先通过 Agent 生成 ASCII 图来规划数据流和状态机,以避免代码实现偏离方向。
本文是对 Alchemy 产品负责人 Matias Castello 的访谈,他讲述了非工程师背景如何通过 AI(Codex 和 GPT)改变工作方式,包括代码审查、产品文档、项目管理,并展示了让 AI 自主执行开发的流程。