我在生产环境前想要的智能体技能栈

Reddit r/AI_Agents 新闻

摘要

一位开发者勾勒了生产级AI智能体的结构化技能栈,涵盖规划、工具使用、权限、恢复、观察、预算和升级,这些被视为显式契约而非松散的工具包装器。

我不断看到关于智能体的讨论将技能定义为“智能体可以使用工具X”。这对生产环境来说显得过于松散。技能应该更接近一种契约:智能体被允许提议什么,需要什么输入,可以触发哪些副作用,必须产生什么证据,以及运行时在半路失败时如何恢复。 在我信任一个智能体处理真实工作流之前,我想要的技能栈: 规划技能:将模糊目标转化为显式步骤序列。计划应成为数据,而不仅仅是隐藏的上下文。 工具使用技能:知道调用哪个工具,同时发出精确的负载模式、版本和预期收据。 权限技能:检查当前步骤是否被允许。不仅仅是“此智能体可以访问CRM”,而是“此具体更新对于此账户、此用户和此策略状态是允许的”。 恢复技能:决定超时、崩溃、重复请求、部分写入或未知外部状态后发生什么。这应该主要是确定性的。 观察技能:以操作员实际可用的方式总结当前状态——发生了什么、什么在等待、什么可以安全重试、什么需要人工介入。 预算技能:控制令牌消耗、工具消耗、延迟和重试限制。一个没有预算的自主智能体只是对你自己的系统进行非常礼貌的拒绝钱包攻击。 升级技能:知道何时停止。某些操作需要人工批准令牌后才能继续。 我目前的倾向是:模型可以擅长规划、解释混乱输入和提议行动。但执行层应拥有权限、收据、幂等性和恢复。 好奇其他人如何在其智能体系统中定义“技能”。它们主要是提示、工具包装器、工作流节点、策略还是其他东西?
查看原文

相似文章

addyosmani/agent-skills

GitHub Trending (daily)

agent-skills 是一套旨在增强 AI 编程代理能力的生产级工程技能集。

agentskills/agentskills

GitHub Trending (daily)

Agent Skills 是 Anthropic 提出的一项开放标准,用于将专业知识和工作流程打包到可移植、版本控制的文件夹中,AI 代理可以按需加载这些文件夹,从而在最小化上下文开销的情况下实现领域专业知识和可重复执行的任务。

关于 AI 智能体的真实内情

Reddit r/AI_Agents

一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。

@op7418: https://x.com/op7418/status/2065232309310427565

X AI KOLs Timeline

This article discusses the concept of Skills in the AI agent ecosystem, arguing that Skills are more than prompts—they are packaged capabilities that externalize human expertise into reusable workflow units. The author shares design principles and case studies from building popular Skills.