self-evolving-agents

标签

Cards List
#self-evolving-agents

通过参数化记忆扩展自进化智能体

arXiv cs.AI · 2天前 缓存

来自阿里巴巴/Qwen和北京大学的研究人员提出了TMEM——一种自进化参数化记忆框架。该框架利用在线LoRA权重更新,使LLM智能体能够在单个回合内真正从经验中学习,而非仅依赖提示空间中的记忆。TMEM在多个基准测试(包括LoCoMo、LongMemEval-S和CL-Bench)上均优于基于摘要和基于检索的基线方法。

0 人收藏 0 人点赞
#self-evolving-agents

EVE-Agent: 可验证证据的自我进化智能体

arXiv cs.AI · 2026-05-25 缓存

EVE-Agent 提出了一个自我进化搜索智能体框架,通过生成问题、答案和证据片段,并基于证据的边际准确性增益进行训练,确保证据可验证性。这提高了基于依据的正确性,且无需人工标注。

0 人收藏 0 人点赞
#self-evolving-agents

重新思考自我进化语言模型智能体中的经验利用

arXiv cs.CL · 2026-05-11 缓存

本文介绍了 ExpWeaver 框架,该框架优化了自我进化语言模型智能体在运行时决策过程中如何利用过往经验。研究表明,基于推理不确定性选择性调用经验,能在多种环境和模型中提升性能。

0 人收藏 0 人点赞
#self-evolving-agents

利用知识图谱路径作为自进化搜索代理的中间监督

arXiv cs.AI · 2026-05-08 缓存

本文介绍了一种利用知识图谱路径作为中间监督来提升自进化搜索代理性能的方法。该方法通过将问题构建建立在关系上下文之上,并引入航点覆盖奖励(Waypoint Coverage Reward)以实现分级部分奖励,从而解决了搜索自博弈(Search Self-Play)中的瓶颈问题。

0 人收藏 0 人点赞
#self-evolving-agents

SkillOS:面向自进化智能体的技能策展学习

Hugging Face Daily Papers · 2026-05-07 缓存

本文介绍了 SkillOS,这是一种强化学习框架,使大型语言模型智能体能够学习用于自进化的长期技能策展策略,从而提升任务性能与泛化能力。

0 人收藏 0 人点赞
#self-evolving-agents

论经验驱动自演化智能体的安全风险

arXiv cs.CL · 2026-04-21 缓存

# 论经验驱动自演化智能体的安全风险 来源:[https://arxiv.org/html/2604.16968](https://arxiv.org/html/2604.16968) Weixiang Zhao1, Yichen Zhang1, Yingshuo Wang1††footnotemark:, Yang Deng2, Yanyan Zhao1, Xuda Zhi3, Yongbo Huang3, Hao He3, Wanxiang Che1, Bing Qin1, Ting Liu1 1哈尔滨工业大学, 2新加坡管理大学, 3SERES \{wxzhao, yiczhang, yswang, yyzhao\}@ir\.hit\.edu\.cn ###### 摘要 经验驱动型自演化已成为一项极具前景的范式

0 人收藏 0 人点赞
← 返回首页

提交意见反馈