如何阻止模型陷入循环

Reddit r/LocalLLaMA 2026/05/21 02:00 新闻

looping model-looping inference-issues tool-calling token-generation troubleshooting qwen

摘要

用户报告，包括Qwen 3.6 35B在内的AI模型在与Copilot Chat或Hermes集成时会出现无限循环，生成过多token或错误的工具调用。

所以我以为这是小模型的问题，但当我添加了一个新的GPU，能够运行像Qwen 3.6 35b q4或q5这样的中低端模型时，这个问题仍然存在。虽然不像小模型那么严重，但当将模型链接到Copilot Chat或Hermes时，模型会在任务中途开始循环思考或循环生成超过40k token，或生成错误的工具调用。

查看原文

相似文章

@dzhng: 一旦你开始运行大量监听事件并永远循环的代理，聊天用户界面就会崩溃。我们正在试验一种…

X AI KOLs Following

Duetchat 推出了一种基于看板的界面，用于管理多个监听事件并永远循环的AI代理，由父协调器控制。

@rohit4verse: 构建可交付的“弱智”AI 循环是目前智能体系统的核心护城河。88% 的代理试点项目采用这种模式，但……

X AI KOLs Timeline

文章讨论了智能体 AI 系统中的常见失败模式，特别是“弱智 AI 循环”，并引用了在 Claude Code 部署中观察到的状态污染和数据泄露等问题。

MartinLoop

Product Hunt

MartinLoop 是一个用于控制 AI 编码代理的工具，带有限制、证明和运行收据。

别再问该跑哪个模型了。其实只有两个。

Reddit r/LocalLLaMA

一位科技爱好者认为，只有两个本地AI模型（Qwen 3.6 35b a3b 和 Qwen 3.6 27b）值得运行，他否定了更小的模型，并推荐对更大模型进行重度量化。

POV：带思考模式的 Qwen 3.5

Reddit r/LocalLLaMA

用户观察到 Qwen 3.5 在生成时陷入重复思考循环。

提交意见反馈