arc-agi

标签

Cards List
#arc-agi

@dylan_works_: 写了一些我最近一直在研究的有趣发现:当 LLM agent 反复将自身经历改写成文本形式的“经验……

X AI KOLs Timeline · 昨天 缓存

这篇研究博客文章表明,反复将 LLM agent 的经历改写成文本形式的“教训”往往会降低性能,而非提升性能。作者发现,在 ARC-AGI 和 ALFWorld 等基准测试中,情景记忆保留的效果优于抽象巩固。

0 人收藏 0 人点赞
#arc-agi

单张4090上11.67% ARC-AGI-2本地评估:TOPAS递归架构

Reddit r/LocalLLaMA · 3天前

作者介绍了TOPAS,一种递归AI架构,在单张RTX 4090上达到了ARC-AGI-2的11.67%,旨在证明架构效率可以超越原始计算能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈