skill-learning

标签

Cards List
#skill-learning

基于状态感知动态检索的Web智能体在线技能学习

arXiv cs.AI · 昨天 缓存

本文提出了SGDR(State-Grounded Dynamic Retrieval,状态感知动态检索),一种面向Web智能体的在线技能学习方法,支持逐步、感知当前状态的技能复用,而非静态的任务级检索。在WebArena上的实验表明,SGDR结合GPT-4.1可达到37.5%的成功率,相较于强基线取得了约10.6%的相对提升。

0 人收藏 0 人点赞
#skill-learning

@rohanpaul_ai:AI智能体应将记忆视为不断变化的有效连接网络,而非静态存储。大多数智能体记忆系统…

X AI KOLs Timeline · 2天前 缓存

该论文提出 FluxMem,一种将智能体记忆视为不断演化的图结构,通过动态修复连接和提炼技能来提升记忆效果的系统。实验显示其在多个任务上优于现有方法,例如在 LoCoMo 上达到 95.06% 准确率,并在 GAIA 上相比 Kimi K2 提升 12.73 分。

0 人收藏 0 人点赞
#skill-learning

MMG2Skill:智能体能否从真实世界指南中提炼出自我进化的技能?

Hugging Face Daily Papers · 4天前 缓存

MMG2Skill通过闭环学习将网络上的过程性指南转化为智能体可执行的技能,在GUI操控、游戏玩法和纸牌游戏任务中提升了性能,宏平均提升了+12.8到+25.3个百分点。

0 人收藏 0 人点赞
#skill-learning

从历史到状态:面向 LLM 智能体的恒定上下文技能学习

arXiv cs.AI · 2026-05-08 缓存

本文介绍了“恒定上下文技能学习”,这是一种将程序性知识从提示词迁移到模型权重中的框架,旨在降低 LLM 智能体的 Token 使用量并提升隐私性。该方法在 ALFWorld 和 WebShop 等基准测试中表现出色,同时显著降低了推理成本。

0 人收藏 0 人点赞
#skill-learning

用于分层强化学习的随机神经网络

OpenAI Blog · 2017-04-10 缓存

OpenAI 研究人员提出了一个使用随机神经网络进行分层强化学习的框架,该框架通过代理奖励引导预训练有用的技能,然后利用这些技能在稀疏奖励或长期视界的下游任务中加速学习。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈