@omarsar0: 自我改进的AI是件大事!作为第一步,我一直在探索后训练过程有多少可以自动化。H…
摘要
Marco Oram分享了他使用Fireworks AI Agent自动化LLM微调的探索,微调了一个小型的Qwen模型,以集成到他的PaperWiki项目中,展示了迈向自我改进AI的一步。
查看缓存全文
缓存时间: 2026/05/21 10:15
自我改进的人工智能是一件大事!
作为第一步,我一直在探索后训练中有多少可以自动化。
这里是一篇关于我如何使用 @FireworksAI_HQ Agent 来自动化 LLM 微调本身的帖子。包含数据集 + 技能文件。
对于这个用例,我从 @karpathy 关于 LLM 知识库的推文中获得了灵感。
我让 Claude Code 与 Fireworks Agent 交互,对一个小型 Qwen 模型进行微调,以获得正确的输出风格,从而高效地持续扩展我的 PaperWiki(https://x.com/omarsar0/status/2042286186920550498?s=20…)。
全部通过自然语言完成。这显然是改进 AI 系统的未来。
PaperWiki 项目的下一步是如何调整模型以更好地“理解”数据。这更难做到,但如果可能,我们就拥有一个极其强大的系统,可以递归地自我改进,并且在知识发现和自动化各种端到端研究等方面极为有用。
更多内容即将推出。感谢 Fireworks 团队让我提前测试。对此超级兴奋。
@omarsar0 我最近做到了,哈哈
帖子附带文档链接。
相似文章
@omarsar0: https://x.com/omarsar0/status/2057114824467792189
本文介绍了使用 Fireworks Agent 自动化微调一个小型开放权重模型,以生成维基百科风格的摘要,从而形成一个自我改进的智能体循环,使得模型训练成为一个可调用的步骤。
@omarsar0:关于自我改进智能体的优秀论文。为什么?我们需要更深入地思考 AI 智能体系统设计。该协议规范……
一篇论文提出了一种自我改进 AI 智能体的协议框架,支持可审计的改进提案、评估与回滚。
@omarsar0: 关于自我改进代理的非常好的建议。(收藏)这是我正在自己的实验中观察到的现象,关于编码...
推文讨论了关于自我改进代理的建议,并分享了在长期任务中使用编码代理的实验观察,指出更强的模型并不总是能产生更好的代理。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766
文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。
@dair_ai: 关于自我改进智能体的优秀论文:
本周一篇重要的AI论文探讨了自我改进智能体是否真正发现新知识,还是仅仅在重新混合现有信息。