如何阻止模型陷入循环
摘要
用户报告,包括Qwen 3.6 35B在内的AI模型在与Copilot Chat或Hermes集成时会出现无限循环,生成过多token或错误的工具调用。
所以我以为这是小模型的问题,但当我添加了一个新的GPU,能够运行像Qwen 3.6 35b q4或q5这样的中低端模型时,这个问题仍然存在。虽然不像小模型那么严重,但当将模型链接到Copilot Chat或Hermes时,模型会在任务中途开始循环思考或循环生成超过40k token,或生成错误的工具调用。
相似文章
@dzhng: 一旦你开始运行大量监听事件并永远循环的代理,聊天用户界面就会崩溃。我们正在试验一种…
Duetchat 推出了一种基于看板的界面,用于管理多个监听事件并永远循环的AI代理,由父协调器控制。
@rohit4verse: 构建可交付的“弱智”AI 循环是目前智能体系统的核心护城河。88% 的代理试点项目采用这种模式,但……
文章讨论了智能体 AI 系统中的常见失败模式,特别是“弱智 AI 循环”,并引用了在 Claude Code 部署中观察到的状态污染和数据泄露等问题。
MartinLoop
MartinLoop 是一个用于控制 AI 编码代理的工具,带有限制、证明和运行收据。
别再问该跑哪个模型了。其实只有两个。
一位科技爱好者认为,只有两个本地AI模型(Qwen 3.6 35b a3b 和 Qwen 3.6 27b)值得运行,他否定了更小的模型,并推荐对更大模型进行重度量化。
POV:带思考模式的 Qwen 3.5
用户观察到 Qwen 3.5 在生成时陷入重复思考循环。