alfworld

#alfworld

SKILL-DISCO：将智能体轨迹提炼并编译为可重用的程序化技能

arXiv cs.AI ↗ · 2026-06-26 缓存

Skill-DisCo 是一个框架，它将可重用的程序化技能从成功的智能体轨迹中提炼出来，并将其编译成可调用、可执行的程序。在 ALFWorld 和 WebArena 上的实验表明，该框架提高了成功率并减少了智能体的回合数。

0 人收藏 0 人点赞

#alfworld

arXiv cs.AI ↗ · 2026-06-03 缓存

介绍了SkillDAG，一种用于大规模LLM技能选择的自进化类型化有向图，它建模了技能间关系，并允许智能体在执行过程中查询和演化该图，在ALFWorld和SkillsBench上优于基线。

0 人收藏 0 人点赞

#alfworld

arXiv cs.AI ↗ · 2026-05-20 缓存

本文首次系统研究了多轮LLM智能体中的信用分配问题，提出了SERL——一种选择性环境重加权学习框架。SERL利用环境反馈在因果相关动作上强化强化学习目标，在ALFWorld和WebShop上分别达到了90.0%和80.1%的成功率。

0 人收藏 0 人点赞