specificity

标签

Cards List
#specificity

Memora: 平衡抽象与具体性的和谐记忆表示

Hacker News Top · 3天前 缓存

Memora 是一个可扩展的 AI 智能体记忆系统,它将存储与检索解耦,在长周期任务上实现了最先进的性能,同时使用的 token 数量减少了高达 98%。该研究发表于 ICML 2026。

0 人收藏 0 人点赞
#specificity

奖励模型的离散化

Hugging Face Daily Papers · 2026-06-19 缓存

本文指出了连续奖励模型在强化学习中的过度敏感问题,即同等质量的回复被赋予不同的分数,并提出了一种使用蒙特卡洛dropout的离散化技术,以减少这种过度敏感,同时保持区分能力,从而得到更好的策略并减少奖励破解。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈