@FinanceYF5: 2/ SkillOpt:把文档当参数来训练 微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。 6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 …
摘要
微软提出SkillOpt方法,将文档作为可训练参数,通过优化自然语言文档而不改动权重来提升模型性能,在6个benchmark上取得52连胜,GPT-5.5提升23.5分,Claude Code提升19.1分。
查看缓存全文
缓存时间: 2026/06/01 11:18
2/📄 SkillOpt:把文档当参数来训练
微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。
6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 +23.5 分,Claude Code 提升 +19.1 分。
相似文章
@omarsar0: 微软研究院的新研究 我看到很多AI工程师手写智能体技能文档,并希望它们能泛化。…
微软研究院推出了SkillOpt,该方法将智能体技能文档视为可训练的外部状态,利用优化器模型进行受限编辑,并通过预留集进行验证。该方案在52个评估单元中取得最佳或并列结果,在GPT-5.5上准确率提升超过23个百分点,且零额外推理成本,技能可迁移。
@Yif_Yang: 介绍 SkillOpt — 一个面向智能体技能的优化器。不再微调模型权重,而是将自然语言…
介绍 SkillOpt,一个将自然语言技能视为可训练外部参数而非微调模型权重的优化器。它通过有界编辑和验证门控实现稳定、可控的技能更新,在 7 个模型的 6 个基准测试的 52 个设置中取得最佳或并列最佳结果。
SkillOpt 将 markdown 技能文件视为可训练参数并配备适当的优化机制
一篇新论文通过将 markdown 技能文件视为可训练参数并使用经过保留集验证的有界编辑,将智能体的技能优化形式化。该方法在不同模型间迁移良好,并提升了程序化基准测试的性能。
@Xudong07452910: 这篇 SkillOpt 论文挺有意思,它其实在讲一件很重要的事: AI Agent 以后不只是靠人写 prompt,而是可以自己训练自己的“工作说明书”。 现在很多 skill / prompt 都是一次性写出来的,真实任务一多,各种边界…
SkillOpt introduces a systematic controllable text-space optimizer that enables AI agents to train and improve their own skills (like 'work instructions') through iterative edits and validation, outperforming human-crafted and one-shot prompts across multiple benchmarks and models.
@DAIEvolutionHub: 微软刚刚开源了一种无需触及模型权重即可“训练”AI智能体的方法 SkillOpt 将简单的 markdown 技能文件视为神经网络参数...
微软开源了 SkillOpt,这是一种将 markdown 技能文件视为神经网络参数来训练 AI 智能体的方法,无需修改模型权重,并使用学习率、验证检查、小批量数据和训练轮次进行优化。