@gippp69:这个人展示了Microsoft Loop,它无需重新训练就将GPT-5.5从41%提升至80%——微软的SkillOpt论文提到…
摘要
这条推文讨论了微软的SkillOpt论文,该论文通过使用一个小的技能文件来指导智能体,在不重新训练的情况下将GPT-5.5的准确率从41%提升至80%。
查看缓存全文
缓存时间: 2026/06/18 04:07
这个家伙展示了微软Loop,将GPT-5.5从41%提升到80%,且无需重新训练
微软的SkillOpt论文指出,智能体并非总需要新模型。有时升级仅需一个微型技能文件,告诉智能体该遵循哪些步骤、使用哪些工具以及如何自我修正
疯狂之处在于:没有改变任何权重,没有新增参数,没有耗费数月算力,没有价值1000万美元的训练任务。SkillOpt观察智能体失败,重写1到4行代码,然后测试下一个版本
在电子表格任务上,GPT-5.5准确率从41%提升至80%;在文档任务上,从33%跃升至72%。在52个模型与任务组合中,技能文件每次都胜出
这就是为什么微软认证的故事更有冲击力。有个人说AI取代了他的工作,随后花了90天学习微软AI技术栈,回来时薪资提升了40%
他赢在不是学提示词,而是学系统:Azure AI、智能体、评估、部署,以及企业愿意支付10万到18万美元的基础设施
在技能文件成为新简历之前,请收藏此文
相似文章
@FinanceYF5: 2/ SkillOpt:把文档当参数来训练 微软把 SKILL.md 当成可训练的模型参数——不改权重,只优化自然语言文档,validation gate 过滤每次改动。 6 个 Benchmark 52 连胜,GPT-5.5 直聊提升 …
微软提出SkillOpt方法,将文档作为可训练参数,通过优化自然语言文档而不改动权重来提升模型性能,在6个benchmark上取得52连胜,GPT-5.5提升23.5分,Claude Code提升19.1分。
@omarsar0: 微软研究院的新研究 我看到很多AI工程师手写智能体技能文档,并希望它们能泛化。…
微软研究院推出了SkillOpt,该方法将智能体技能文档视为可训练的外部状态,利用优化器模型进行受限编辑,并通过预留集进行验证。该方案在52个评估单元中取得最佳或并列结果,在GPT-5.5上准确率提升超过23个百分点,且零额外推理成本,技能可迁移。
@NFTCPS: 微软搞了个东西叫 SkillOpt,思路挺野:把 agent 的技能文档当成神经网络一样来训练,有 epoch、batch、学习率、验证集,但一根模型权重都不碰。 它牛在哪?我给你拆三点: 训练只改一份 skill 文档,新的改动必须在验…
微软推出SkillOpt,一种将智能体技能文档像神经网络一样训练的方法,通过epoch、batch、学习率和验证集来进行优化,但不修改模型权重。在多项基准测试中取得最佳结果,可跨模型和工具迁移。
@DAIEvolutionHub: 微软刚刚开源了一种无需触及模型权重即可“训练”AI智能体的方法 SkillOpt 将简单的 markdown 技能文件视为神经网络参数...
微软开源了 SkillOpt,这是一种将 markdown 技能文件视为神经网络参数来训练 AI 智能体的方法,无需修改模型权重,并使用学习率、验证检查、小批量数据和训练轮次进行优化。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387
本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。