@shawntenam:GEPA(http://github.com/gepa-ai/gepa)通过自动优化提示指令,把 Haiku 4.5 的通过率从 65% 提升到 85%
摘要
GEPA 是一款开源工具,可基于执行轨迹和评分自动优化提示指令,无需更换模型,就能将 Claude Haiku 4.5 的通过率从 65% 提升到 85%。
GEPA(http://github.com/gepa-ai/gepa)通过结合执行轨迹与评分,自动优化我的提示指令,将 Haiku 4.5 的通过率从 65% 提升到 85%。它就像针对 CLAUDE.md 文件的精准提示调优,无需更换模型。开发者们,赶紧拿去跑一把。
相似文章
@kapicode: 我一直在使用 Claude 作为“人类”来提示 @opencode 以重建参考项目,在同一测试平台上评估了四款 LLM…
一项针对四款大语言模型(Qwen、MiniMax、GLM)的评估显示,当使用 Claude 作为 Opencode 智能体工具的提示器时,一个较小的本地模型(运行在 3090 显卡上的 Qwen 27B)在代码质量与可靠性方面表现优于更大的剪枝模型。
@learnwithella:Claude Code 的自进化技能简直离谱 一次循环 → 10 次测试,按评估打分,重写提示词,再测试,保留胜者……
Claude Code 可通过运行评估、自动重写提示词并保留最优结果,实现提示词自迭代,让“钩子文案”技能一夜之间从 32/50 飙到 47/50。
@dhh:过去一周多我一直在使用低推理模式下的 GPT5.5,效果非常好,效率极高。完全没有想转向 Opus 的冲动……
DHH 称赞 GPT-5.5 在低推理设置下的表现和效率,指出其超越了 Opus 和 Kimi。
@HenryL_AI:重磅更新:@gepa_ai 已被社区成员正式集成进 A-Evolve!
社区成员将 GEPA 进化算法做成即插即用组件植入 A-Evolve,任何智能体无需配置即可调用 GEPA。
动态分配计算预算给困难问题集,并通过Qwen-35B-A3B演化各模块,使性能在HLE上接近GPT-5.4-xHigh
一种使用Qwen-35B-A3B动态分配计算预算给困难问题的方法,在HLE基准测试上达到了接近GPT-5.4-xHigh的性能。