我需要一个容易陷入循环的模型。

Reddit r/LocalLLaMA 新闻

摘要

一位开发者寻找一个经常陷入循环的模型(如GLM Flash),以测试智能体的循环检测与恢复功能,旨在开发启发式算法来评估循环概率并实现回溯。

我正在测试我们智能体中的循环识别、保护与恢复功能,需要一个经常陷入循环的模型。我最近见过最糟糕的是在低温度和极端量化下的GLM Flash。如果有一个模型大约75%的时间以各种方式陷入循环,而25%的时间能良好调用工具,那将非常理想,可用于建立测试框架。目标是能通过启发式方法判断循环的特征,并为输出分配一个分数,表示模型陷入循环的概率,从而让智能体能够回溯并重新提示,直到打破循环。您认为哪个模型能提供最好的样本数据?
查看原文

相似文章

如何阻止模型陷入循环

Reddit r/LocalLLaMA

用户报告,包括Qwen 3.6 35B在内的AI模型在与Copilot Chat或Hermes集成时会出现无限循环,生成过多token或错误的工具调用。

Looped World Models

Hugging Face Daily Papers

Looped World Models 通过共享的Transformer块引入迭代潜在状态细化,实现了100倍的参数效率,同时根据预测复杂度自适应调整计算深度。