@FinanceYF5: 2/ SkillOpt:把文档当参数来训练 微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。 6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 …

X AI KOLs Following 论文

摘要

微软提出SkillOpt方法,将文档作为可训练参数,通过优化自然语言文档而不改动权重来提升模型性能,在6个benchmark上取得52连胜,GPT-5.5提升23.5分,Claude Code提升19.1分。

2/📄 SkillOpt:把文档当参数来训练 微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。 6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 +23.5 分,Claude Code 提升 +19.1 分。
查看原文
查看缓存全文

缓存时间: 2026/06/01 11:18

2/📄 SkillOpt:把文档当参数来训练

微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。

6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 +23.5 分,Claude Code 提升 +19.1 分。

相似文章

@Xudong07452910: 这篇 SkillOpt 论文挺有意思,它其实在讲一件很重要的事: AI Agent 以后不只是靠人写 prompt,而是可以自己训练自己的“工作说明书”。 现在很多 skill / prompt 都是一次性写出来的,真实任务一多,各种边界…

X AI KOLs Timeline

SkillOpt introduces a systematic controllable text-space optimizer that enables AI agents to train and improve their own skills (like 'work instructions') through iterative edits and validation, outperforming human-crafted and one-shot prompts across multiple benchmarks and models.