技能库漂移：诊断与修复自进化LLM技能库中的隐性故障模式

arXiv cs.AI 2026/05/20 04:00 论文

self-evolving-skill-libraries library-drift llm retrieval diagnostics governance performance-degradation

摘要

本文识别了'技能库漂移'作为自进化LLM技能库中的一种隐性故障模式，其中无限制的技能积累导致检索退化与性能停滞。它提供了踪迹级诊断及经过验证的治理方案，将MBPP+ hard-100上的pass@1从0.258提升至0.584。

arXiv:2605.19576v1 Announce Type: new 摘要：自进化技能库面临一种我们称之为\emph{技能库漂移}的隐性故障模式：无结果驱动的生命周期管理的无限制技能积累导致检索退化、假阳性注入和性能停滞。近期评估确认了该症状——LLM编写的技能带来+0.0pp增益，而人工整理的技能带来+16.2pp（SkillsBench）——然而其根本机制尚未被隔离。我们提供了(1) 可复现的触发条件：隔离漂移的消融实验——一种禁用技能注入（平底，+0.002），另一种施加提前退休（主动危害，$-0.019$）；(2) 踪迹级诊断：一个仅追加的证据日志，包含每个技能的贡献分数、归因判定和路由器参与指标，使故障在到达端任务分数之前变得可见；以及(3) 经过验证的修复方案：一个最小治理方案（结果驱动的退休 + 有界活跃容量 + 元技能编写先验），在MBPP+ hard-100上经过100轮将保留的pass@1从0.258基线提升至晚期窗口均值0.584（滚动增益$+0.328$）。八组消融实验分解了哪些治理机制是承重的，哪些被取代，为诊断任何自进化智能体中的技能库漂移提供了具体操作手册。

查看原文

技能库漂移：诊断与修复自进化LLM技能库中的隐性故障模式

相似文章

LLM智能体系统中技能的规模化定律

技能自我对弈（Skill Self-Play）：通过协同进化技能推动大语言模型能力前沿

SkillDAG：大规模LLM技能选择中的自进化类型化技能图

构建独立LLM漂移检测 - 分享方法论，寻求对方法的反馈

盲人策展人：有偏见的评委如何悄无声息地禁用自进化代理中的技能退出机制

提交意见反馈