dialogue-agents

标签

Cards List
#dialogue-agents

CoreMem: 对话代理中长期记忆的黎曼检索与Fisher引导蒸馏

arXiv cs.CL · 2026-06-18 缓存

CoreMem提出了一种资源高效的边缘-云端内存架构,用于对话代理,采用基于Fisher-Rao度量的黎曼检索和Fisher引导的离散令牌蒸馏,在8 GB VRAM预算内实现了显著的准确性提升。

0 人收藏 0 人点赞
#dialogue-agents

G-Long: 图增强内存管理用于高效长期对话代理

arXiv cs.CL · 2026-06-12 缓存

G-Long 提出了一种用于长期对话代理的图增强内存管理框架,利用微调的小型语言模型进行结构化三元组提取和关联检索,在响应生成和内存检索方面取得了最先进的性能,同时降低了计算开销。

0 人收藏 0 人点赞
#dialogue-agents

从静态上下文到校准的交互式强化学习:通过对齐模拟器缓解多轮对话中的分布偏移

arXiv cs.AI · 2026-05-27 缓存

本文从理论上识别并缓解了多轮对话强化学习中的上下文分布偏移,提出了校准交互式RL,该框架将交互式RL与模拟器对齐相结合,以减少模拟到真实的差距并实现最先进的性能。

0 人收藏 0 人点赞
#dialogue-agents

SAVOIR:基于Shapley值奖励归因的社交技巧学习框架

Hugging Face Daily Papers · 2026-04-21 缓存

SAVOIR框架将合作博弈论与Shapley值应用于语言智能体训练,显著提升其社交智能,在SOTOPIA基准上刷新SOTA,并达到GPT-4o水平。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈