@omarsar0: 自我改进的AI是件大事!作为第一步,我一直在探索后训练过程有多少可以自动化。H…

X AI KOLs Following 新闻

摘要

Marco Oram分享了他使用Fireworks AI Agent自动化LLM微调的探索,微调了一个小型的Qwen模型,以集成到他的PaperWiki项目中,展示了迈向自我改进AI的一步。

自我改进的AI是件大事! 作为第一步,我一直在探索后训练过程有多少可以自动化。 这是第一篇关于我如何使用@FireworksAI_HQ Agent来自动化LLM微调的帖子。 包含了数据集和技能文件。 这个用例的灵感来自@karpathy关于LLM知识库的推文。 我让Claude Code与Fireworks Agent交互,微调一个小型Qwen模型,以获得正确的输出风格,从而有效增长我的PaperWiki(https://x.com/omarsar0/status/2042286186920550498?s=20…)。 这一切都通过自然语言完成。这显然是未来改进AI系统的方式。 PaperWiki项目的下一步是如何调整模型以更好地“理解”数据。这更难做到,但如果可能的话,我们将拥有一个极其强大的系统,可以递归地自我改进,并且在知识发现和端到端自动化各种研究等方面非常有用。 更多内容即将发布。感谢Fireworks团队让我提前测试。对此感到非常兴奋。
查看原文
查看缓存全文

缓存时间: 2026/05/21 10:15

自我改进的人工智能是一件大事!

作为第一步,我一直在探索后训练中有多少可以自动化。

这里是一篇关于我如何使用 @FireworksAI_HQ Agent 来自动化 LLM 微调本身的帖子。包含数据集 + 技能文件。

对于这个用例,我从 @karpathy 关于 LLM 知识库的推文中获得了灵感。

我让 Claude Code 与 Fireworks Agent 交互,对一个小型 Qwen 模型进行微调,以获得正确的输出风格,从而高效地持续扩展我的 PaperWiki(https://x.com/omarsar0/status/2042286186920550498?s=20…)。

全部通过自然语言完成。这显然是改进 AI 系统的未来。

PaperWiki 项目的下一步是如何调整模型以更好地“理解”数据。这更难做到,但如果可能,我们就拥有一个极其强大的系统,可以递归地自我改进,并且在知识发现和自动化各种端到端研究等方面极为有用。

更多内容即将推出。感谢 Fireworks 团队让我提前测试。对此超级兴奋。

@omarsar0 我最近做到了,哈哈

帖子附带文档链接。

相似文章

@omarsar0: https://x.com/omarsar0/status/2057114824467792189

X AI KOLs Following

本文介绍了使用 Fireworks Agent 自动化微调一个小型开放权重模型,以生成维基百科风格的摘要,从而形成一个自我改进的智能体循环,使得模型训练成为一个可调用的步骤。

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766

X AI KOLs Timeline

文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。