memory-evaluation

标签

Cards List
#memory-evaluation

@_akhaliq: LongMINT 在长时域代理系统中评估多目标干扰下的记忆

X AI KOLs Following · 2026-05-21 缓存

LongMINT 是一个基准测试,用于在长时域代理系统中评估多目标干扰下的记忆性能。

0 人收藏 0 人点赞
#memory-evaluation

MEME:多实体与动态记忆评估

Hugging Face Daily Papers · 2026-05-12 缓存

MEME 基准测试在多实体和动态变化的条件下评估 AI 记忆系统,揭示了即便采用先进的检索技术,在依赖关系推理方面依然存在显著挑战。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈