@gippp69:这个人展示了Microsoft Loop,它无需重新训练就将GPT-5.5从41%提升至80%——微软的SkillOpt论文提到…

X AI KOLs Timeline 论文

摘要

这条推文讨论了微软的SkillOpt论文,该论文通过使用一个小的技能文件来指导智能体,在不重新训练的情况下将GPT-5.5的准确率从41%提升至80%。

这个人展示了Microsoft Loop,无需重新训练就将GPT-5.5从41%提升至80% 微软的SkillOpt论文指出,智能体并不总是需要新模型。有时候,升级仅仅是一个微小的技能文件,告诉智能体该遵循哪些步骤、使用哪些工具以及如何自我纠正 疯狂的是,没有任何权重被改变。没有新参数,没有数月的计算,也没有1000万美元的训练运行。SkillOpt观察智能体失败,重写1到4行代码,然后测试下一个版本 在电子表格任务上,GPT-5.5的准确率从41%升至80%。在文档任务上,从33%跃升至72%。在52种模型和任务设置中,技能文件每次都获胜 这就是为什么微软认证的故事更令人震撼。一个人说AI取代了他的工作,然后花了90天学习微软的AI堆栈,回来时薪水高了40% 他不是靠学习提示词获胜,而是靠学习系统:Azure AI、智能体、评估、部署以及公司花费10万到18万美元的基础设施 在技能文件成为新简历之前,先收藏这个
查看原文
查看缓存全文

缓存时间: 2026/06/18 04:07

这个家伙展示了微软Loop,将GPT-5.5从41%提升到80%,且无需重新训练

微软的SkillOpt论文指出,智能体并非总需要新模型。有时升级仅需一个微型技能文件,告诉智能体该遵循哪些步骤、使用哪些工具以及如何自我修正

疯狂之处在于:没有改变任何权重,没有新增参数,没有耗费数月算力,没有价值1000万美元的训练任务。SkillOpt观察智能体失败,重写1到4行代码,然后测试下一个版本

在电子表格任务上,GPT-5.5准确率从41%提升至80%;在文档任务上,从33%跃升至72%。在52个模型与任务组合中,技能文件每次都胜出

这就是为什么微软认证的故事更有冲击力。有个人说AI取代了他的工作,随后花了90天学习微软AI技术栈,回来时薪资提升了40%

他赢在不是学提示词,而是学系统:Azure AI、智能体、评估、部署,以及企业愿意支付10万到18万美元的基础设施

在技能文件成为新简历之前,请收藏此文

相似文章

@NFTCPS: 微软搞了个东西叫 SkillOpt,思路挺野:把 agent 的技能文档当成神经网络一样来训练,有 epoch、batch、学习率、验证集,但一根模型权重都不碰。 它牛在哪?我给你拆三点: 训练只改一份 skill 文档,新的改动必须在验…

X AI KOLs Timeline

微软推出SkillOpt,一种将智能体技能文档像神经网络一样训练的方法,通过epoch、batch、学习率和验证集来进行优化,但不修改模型权重。在多项基准测试中取得最佳结果,可跨模型和工具迁移。

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387

X AI KOLs Timeline

本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。