标签
对8个AI编程代理在构建VPS管理工具包上的基准测试发现,四个实现中只有一个可投入生产,总成本1.94美元,规划与代码成本比为1:28。
该项目收录了170个生产级Claude技能包,覆盖9个领域,包含指令文档、Python脚本和参考资源,可直接安装使用,支持多种AI编码工具。
谷歌团队发布了一份50页指南,讲解从vibe编码转向智能体工程,重点关注使用AI智能体的软件开发生命周期,强调大多数失败是系统框架的失败,而非模型的失败。
作者描述了一次语音代理通话在600秒时被无预警切断的情况,并提出了一种优雅处理最大通话时长的测试方法,包括切断前警告和状态保存。
一种用于构建智能代理后端的架构方法,该方法使用独立的工作单元,这些单元可以在没有集成代码的情况下组合在一起,并运行在一个共享引擎上,该引擎提供队列、状态、发布订阅、可观测性、HTTP、沙箱和定时任务功能。
本文介绍了iii,一个开源平台,用于使用可组合的worker构建生产级智能后端,取代传统的服务集成,为后端工程提供类似React的范式。
一位资深谷歌工程师免费发布了421页的AI构建指南《Agentic Design Patterns》,内含代码,可直接用于生产环境。
LangChain 官方开源了 Deep Agent,一个开箱即用的 agent harness,支持长任务、多步工作流,可插拔组件,模型无关,生产就绪。
Angular v22 发布,将 Signal Forms、Angular Aria 和 Asynchronous Reactivity APIs 提升至生产就绪状态,并带来了各种稳定性和易用性改进。
Kakuna 是一种通过自动化繁琐任务来加固代码库的技能,它能生成可用于生产的提交并附带审计记录,同时将对如何为人类和智能体访问设计应用的观点编码到其中,专注于子智能体并行和“鲻鱼工厂”方法。
正在开发一项技能,将一款「随手拼凑的粗糙应用」转变为生产就绪、端到端测试、可维护、可并行的智能体仓库,经过16小时的103次提交后,最终得到了一个健壮的代码库。
Pyrefly,一款开源 Python 类型检查器和语言服务器,现已发布 v1.0,标志着其达到生产就绪状态,同时带来了显著的性能提升,并被 PyTorch 和 NumPy 等主要代码库所采用。
OptiLLM 是一款开源推理代理,采用先进技术无需重新训练即可将 LLM 推理准确性提升高达 10 倍,兼容各种 AI API。
本文深入解析了FactoryAI的Missions多智能体架构,通过角色分工、验证合约与结构化交接机制,实现了可在生产环境中连续稳定运行数十天的自动化编码系统。该设计将软件工程瓶颈从人工执行转向人类注意力管理,为开发者提供了可落地的长期多智能体协作方案。
This article introduces 7 production-ready skills from the Hermes Skills Hub, covering the full lifecycle from tool integration and structured output to deployment, observability, and security.
Google 发布 Gemini 2.5 Flash-Lite 作为稳定版本并正式上线,这是 Gemini 2.5 系列中速度最快、成本最低的模型,定价为每 100 万个令牌 $0.10(输入)/$0.40(输出),具备原生推理能力和与原生工具的完全功能对等。
# 推出 gpt-realtime 和实时 API 更新,用于生产级语音智能体 来源:[https://openai.com/index/introducing-gpt-realtime/](https://openai.com/index/introducing-gpt-realtime/) 今天我们推出了正式版实时 API,包含新功能,使开发者和企业能够构建可靠的、生产级就绪的语音智能体。该 API 现已支持远程 MCP 服务器、图像输入和通过会话初始协议 (SIP) 进行电话呼叫,使语音智能体更