结构化工作流与小规模本地模型的力量
摘要
作者详细介绍了使用小型本地模型(Qwen3.5 9B)结合结构化工作流和map-reduce模式来管理上下文限制、构建自定义智能体循环的经验,并已用其取代Claude Code处理大部分任务。
一个月前,我用一个非常基本的自制智能体循环搭配少量工具进行了实验,尽管其简陋程度令人惊讶,但效果却出奇地好:https://www.reddit.com/r/LocalLLaMA/comments/1sl7f8e/homerolled_loop_agent_is_surprisingly_effective/
后来,我写文章谈到了开发自己的智能体循环是多么令人上瘾,尤其是当它达到能够自我编辑的程度时:https://www.reddit.com/r/LocalLLaMA/comments/1sq7cie/warning_do_not_write_your_own_ai_agent_if_you/
结果,28天后,事情一发不可收拾。我为此一直工作到凌晨5点,因为它实在太让人上瘾了。一旦你拥有一个良好的智能体设置,你会很快意识到,作为人类,你自己才是主要的瓶颈。你有一个庞大的待办事项列表,但智能体却闲置着,等待你的批准和审查。不仅如此,由于我使用的是Qwen3.5 9B模型,其智能能力和上下文窗口都有限。我不能把数百个数据文件一股脑地扔给它,指望它同时处理所有内容。因此,我考虑通过map-reduce模式来管理上下文限制,将任务分解成更小的块,这些块可以并行运行,以在不超过上下文限制的情况下从GPU中榨取最大的FLOPs。强制使用结构化输出也有助于减少LLM的变异性,并实现平滑的reduce步骤。最后,拥有一个数据库来监控和跟踪工作流程也很有帮助。今天成功将其搭建并运行起来,很高兴看到小型本地模型能够处理这一任务。现在,我的自定义智能体已经取代了Claude Code 99%的任务。该智能体尚未发布,但我希望将来某个时候能将其开源。
相似文章
@hooeem: https://x.com/hooeem/status/2062266452921491934
一份指南,解释如何通过将固定流程编译成更小的微调模型,而不是反复提示前沿模型,从而使代理工作流成本降低高达462倍。
@ttunguz:我一直在用最先进的模型训练我电脑上的小模型如何像我一样工作。结果:一个人...
使用大型AI模型训练较小的本地模型,作者构建了一个管理邮件、日历、交易、博客和研究的个人助手。
我从零重建了一个Claude Code风格的编程代理——整个代理循环只有6行代码。20章,约5000行代码,无框架,也支持本地模型
一位开发者分享了一个20章的教程,从头重建了一个Claude Code风格的编程代理,展示了整个代理循环(约6行代码),并支持本地模型和多种LLM API。
有人在智能体工作流中使用过SLMs吗?
一位用户向社区询问在智能体工作流中使用小型/本地语言模型执行特定任务(如路由、分类和提取)的情况,并分享了对大型模型是否总是必要的思考。
@AdamRLucek: 我对代理集群(即工作流)持乐观态度。代理正越来越多地被用于分析整理海量数据……
作者讨论了在规模化处理非结构化数据时,代理集群/工作流的使用日益增长,并指出当并行部署超过30个子代理时,可靠执行会显著下降,同时预告了一种将智能决策与可靠任务执行相结合的解决方案。