skill-curation

#skill-curation

并非所有技能都有帮助：衡量与修复智能体知识

arXiv cs.CL ↗ · 5天前缓存

本文指出，在LLM智能体中简单积累技能可能导致性能倒退，因为对某些任务有益的技能反而会损害其他任务。作者提出Assay框架，该框架衡量每个技能的因果贡献，并对每个任务进行掩码处理，在不更新权重的情况下，在AppWorld和τ-bench上取得了最先进的结果。

0 人收藏 0 人点赞

#skill-curation

TLDR AI ↗ · 2026-05-11 缓存

Google Cloud AI Research 推出 SkillOS，这是一种强化学习框架，使基于 LLM 的智能体能够通过从过往经验中提炼可复用技能来实现自我进化。

0 人收藏 0 人点赞

#skill-curation

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

本文介绍了 SkillOS，这是一种强化学习框架，使大型语言模型智能体能够学习用于自进化的长期技能策展策略，从而提升任务性能与泛化能力。

0 人收藏 0 人点赞