agent-testing

标签

Cards List
#agent-testing

当智能体框架一半是非确定性的,你如何实际测试它?

Reddit r/AI_Agents · 昨天

关于测试包含非确定性组件的AI智能体框架所面临的挑战的讨论,探讨了黄金输出差异比较和使用LLM作为评判者等方法,同时质疑这些方法的有效性。

0 人收藏 0 人点赞
#agent-testing

我需要一个容易陷入循环的模型。

Reddit r/LocalLLaMA · 4天前

一位开发者寻找一个经常陷入循环的模型(如GLM Flash),以测试智能体的循环检测与恢复功能,旨在开发启发式算法来评估循环概率并实现回溯。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈