skill-learning

#skill-learning

基于状态感知动态检索的Web智能体在线技能学习

arXiv cs.AI ↗ · 昨天缓存

本文提出了SGDR（State-Grounded Dynamic Retrieval，状态感知动态检索），一种面向Web智能体的在线技能学习方法，支持逐步、感知当前状态的技能复用，而非静态的任务级检索。在WebArena上的实验表明，SGDR结合GPT-4.1可达到37.5%的成功率，相较于强基线取得了约10.6%的相对提升。

0 人收藏 0 人点赞

#skill-learning

@rohanpaul_ai：AI智能体应将记忆视为不断变化的有效连接网络，而非静态存储。大多数智能体记忆系统…

X AI KOLs Timeline ↗ · 2天前缓存

该论文提出 FluxMem，一种将智能体记忆视为不断演化的图结构，通过动态修复连接和提炼技能来提升记忆效果的系统。实验显示其在多个任务上优于现有方法，例如在 LoCoMo 上达到 95.06% 准确率，并在 GAIA 上相比 Kimi K2 提升 12.73 分。

0 人收藏 0 人点赞

#skill-learning

MMG2Skill：智能体能否从真实世界指南中提炼出自我进化的技能？

Hugging Face Daily Papers ↗ · 4天前缓存

MMG2Skill通过闭环学习将网络上的过程性指南转化为智能体可执行的技能，在GUI操控、游戏玩法和纸牌游戏任务中提升了性能，宏平均提升了+12.8到+25.3个百分点。

0 人收藏 0 人点赞

#skill-learning

从历史到状态：面向 LLM 智能体的恒定上下文技能学习

arXiv cs.AI ↗ · 2026-05-08 缓存

本文介绍了“恒定上下文技能学习”，这是一种将程序性知识从提示词迁移到模型权重中的框架，旨在降低 LLM 智能体的 Token 使用量并提升隐私性。该方法在 ALFWorld 和 WebShop 等基准测试中表现出色，同时显著降低了推理成本。

0 人收藏 0 人点赞

#skill-learning

用于分层强化学习的随机神经网络

OpenAI Blog ↗ · 2017-04-10 缓存

OpenAI 研究人员提出了一个使用随机神经网络进行分层强化学习的框架,该框架通过代理奖励引导预训练有用的技能,然后利用这些技能在稀疏奖励或长期视界的下游任务中加速学习。

0 人收藏 0 人点赞

skill-learning

基于状态感知动态检索的Web智能体在线技能学习

@rohanpaul_ai：AI智能体应将记忆视为不断变化的有效连接网络，而非静态存储。大多数智能体记忆系统…

MMG2Skill：智能体能否从真实世界指南中提炼出自我进化的技能？

从历史到状态：面向 LLM 智能体的恒定上下文技能学习

用于分层强化学习的随机神经网络

提交意见反馈