如何阻止模型陷入循环

Reddit r/LocalLLaMA 新闻

摘要

用户报告,包括Qwen 3.6 35B在内的AI模型在与Copilot Chat或Hermes集成时会出现无限循环,生成过多token或错误的工具调用。

所以我以为这是小模型的问题,但当我添加了一个新的GPU,能够运行像Qwen 3.6 35b q4或q5这样的中低端模型时,这个问题仍然存在。虽然不像小模型那么严重,但当将模型链接到Copilot Chat或Hermes时,模型会在任务中途开始循环思考或循环生成超过40k token,或生成错误的工具调用。
查看原文

相似文章

MartinLoop

Product Hunt

MartinLoop 是一个用于控制 AI 编码代理的工具,带有限制、证明和运行收据。