precision-benchmark

#precision-benchmark

记忆检索底层存在缺陷。

Reddit r/AI_Agents ↗ · 昨天

PrecisionMemBench 是一个开源基准测试，它将检索精度作为严格的单元测试来检验，结果揭示了诸如 Mem0、Zep 和 Hindsight 等流行的记忆框架精度极低（0.05-0.09），并且依赖 LLM 来弥补。文章主张在生产级记忆基础设施中对精度采取零容忍的硬失败策略。

0 人收藏 0 人点赞