Turing Post (@TheTuringPost) 在 X 上
摘要
本文解释了从提示工程到技能工程的转变,并介绍了用于训练、维护和优化技能的方法,如 SkillOpt、SkillOps 和 SkillMOO。
查看缓存全文
缓存时间: 2026/06/15 15:38
AI 101:从提示工程到技能工程
面向AI智能体的技能工程清晰指南,附全新免费方法:SkillOpt、SkillOps和SkillMOO,用于训练、维护和优化技能
如今,你可能正在日常工作中使用(或至少尝试过)像OpenClaw和Hermes Agent这样的个人AI智能体。它们已经拥有了一批忠实用户,包括黄仁勋,而且人气还在不断增长。这些智能体高效运作的部分原因在于可复用技能:一类定义智能体如何使用工具、构建工作流、做出决策以及解决重复性任务的指令包。技能已成为智能体行为运作的核心。
但需求正在变化。过去,提升智能体性能主要依靠提示工程和上下文工程。这已经不够了——技能现在承载了额外的上下文和知识层,这自然引出一个问题:如何优化技能本身?
目前,大多数技能由人工编写、由LLM一次性生成,或通过试错不断完善。(Hermes指出了一个更好的方向,即在使用过程中改进技能,但更广泛的实践仍停留在临时修补阶段。)最近出现了几种方法,使技能的自我改进系统化:一种用于训练单个技能,一种用于管理整个技能库,还有一种专门针对软件工程优化技能。
我们将逐一详细解析每种方法的工作原理,让你能够将相关理念应用到自己的智能体工作流中。技能工程仍处于早期阶段,大多数人尚未关注。但我们已在关注。让我们深入探讨!
从提示工程到技能工程
让我们从主要概念和描述开始。这个话题中的工程是指我们如何设计智能体周围的整个运行环境。有三个层面可以操作。
提示工程
提示工程是最熟悉的一种。它意味着为特定请求编写良好的指令。你告诉模型你想要什么,可能赋予它一个角色、约束条件、示例、格式规则和成功标准。例如:“用简单语言总结这篇论文,聚焦方法部分,给我五个主要收获。”
主要特点:提示工程通常是局部且情境特定的,因为它帮助模型在当下更好地完成一个任务。
然而,优秀的指令无法弥补缺失的上下文。一条提示可以写得完美,但如果模型没有正确的文档、工具、记忆或任务状态,它仍然会失败。这就引出了第二个层面。
上下文工程
上下文工程是指在运行时为模型构建合适的环境。它包含系统消息、工具描述、检索到的文档、记忆、示例、当前任务状态、之前的行动、约束、权限,有时还包括模型的token、时间或工具调用预算。
换句话说,这是创建模型或智能体在行动或响应时应该了解和访问的基本上下文。而这个上下文正是你需要优化的内容,因为:
- 不同的智能体需要不同的上下文,比如编码智能体需要相关文件、测试、问题描述、仓库结构,而研究智能体需要论文、引用、假设、笔记和实验结果。
- 上下文太少会让智能体猜测,太多则会让它分心或成本过高。
- 过时的上下文会让智能体自信地犯错,而嘈杂的检索上下文可能将它引向无关的决策。
最新的层面是 →
面向AI智能体的技能工程:是什么?
这部分需要创建可复用能力包,使智能体能够在任务中发现、应用、改进、版本控制和迁移这些包。简单来说,**技能是一个迷你流程:**它告诉智能体不仅该做什么,还告诉它如何再次完成。
这使得技能更接近软件制品,而非一次性提示。一条提示通常为一种情境而写。技能则旨在跨情境存活。它可以被测试、维护、在智能体间共享,并随工作流变化而更新。
当智能体变成更长期的运行系统时,这一点变得尤为重要。智能体重复一种工作流的次数越多,给该工作流赋予稳定形态的价值就越大。一个技能库可以使智能体的行为更一致、更可检查,并更易于随时间改进。
但还有另一面。如果技能成为智能体栈的一部分,它们也会成为错误、误用和攻击的新表面。
这正是我们接下来要关注的重点。
SkillOpt:训练一个可复用的智能体技能
在所有旨在改进智能体技能的努力中,微软最近的一项研究非常突出。他们提出了SkillOpt,即**“一种系统化的、可控的文本空间优化器,用于智能体技能。”** SkillOpt将技能文档本身视为可训练的对象。 它创建了一个管道:“智能体 → 技能 → 自我改进的工作流”。核心转折在于→
阅读完整文章:https://www.turingpost.com/p/from-prompt-engineering-to-skill-engineering
相似文章
@op7418: https://x.com/op7418/status/2065232309310427565
This article discusses the concept of Skills in the AI agent ecosystem, arguing that Skills are more than prompts—they are packaged capabilities that externalize human expertise into reusable workflow units. The author shares design principles and case studies from building popular Skills.
@omarsar0: 微软研究院的新研究 我看到很多AI工程师手写智能体技能文档,并希望它们能泛化。…
微软研究院推出了SkillOpt,该方法将智能体技能文档视为可训练的外部状态,利用优化器模型进行受限编辑,并通过预留集进行验证。该方案在52个评估单元中取得最佳或并列结果,在GPT-5.5上准确率提升超过23个百分点,且零额外推理成本,技能可迁移。
@Xudong07452910: 这篇 SkillOpt 论文挺有意思,它其实在讲一件很重要的事: AI Agent 以后不只是靠人写 prompt,而是可以自己训练自己的“工作说明书”。 现在很多 skill / prompt 都是一次性写出来的,真实任务一多,各种边界…
SkillOpt introduces a systematic controllable text-space optimizer that enables AI agents to train and improve their own skills (like 'work instructions') through iterative edits and validation, outperforming human-crafted and one-shot prompts across multiple benchmarks and models.
@Yif_Yang: 介绍 SkillOpt — 一个面向智能体技能的优化器。不再微调模型权重,而是将自然语言…
介绍 SkillOpt,一个将自然语言技能视为可训练外部参数而非微调模型权重的优化器。它通过有界编辑和验证门控实现稳定、可控的技能更新,在 7 个模型的 6 个基准测试的 52 个设置中取得最佳或并列最佳结果。
SkillOpt:自我进化智能体技能的执行策略
SkillOpt 引入了一种系统化的文本空间优化器,用于智能体技能。该优化器将技能训练为智能体的外部状态,具有稳定的更新和零部署推理开销,在多个基准测试和执行环境中实现了卓越性能。