SkCC:面向跨框架 LLM 代理的便携式安全技能编译
摘要
SkCC 是一个编译框架,利用强类型中间表示实现在不同框架间可移植地部署代理技能,同时强制执行安全性,显著提升性能并减少维护负担。
查看缓存全文
缓存时间: 2026/05/11 14:53
论文页面 - SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents
来源:https://huggingface.co/papers/2605.03353
摘要
SkCC 是一个编译框架,它采用强类型中间表示,使智能体技能能够在不同平台上进行可移植部署,同时确保安全并提升性能。
LLM-Agents (https://huggingface.co/papers?q=LLM-Agents) 已演变为用于执行复杂任务的自主系统,其中 SKILL.md (https://huggingface.co/papers?q=SKILL.md) 规范已成为封装智能体能力的事实标准。然而,一个关键瓶颈依然存在:不同的 agent frameworks (https://huggingface.co/papers?q=agent%20frameworks) 对 prompt formatting (https://huggingface.co/papers?q=prompt%20formatting) 的敏感度差异显著,导致性能波动高达 40%,但几乎所有技能都以单一、与格式无关的 Markdown 版本存在。针对每个平台手动重写带来了难以承受的维护负担,而此前的审计发现,超过三分之一的社区技能包含 security vulnerabilities (https://huggingface.co/papers?q=security%20vulnerabilities)。为解决这一问题,我们提出了 SkCC (https://huggingface.co/papers?q=SkCC),这是一个将经典编译器设计引入智能体技能开发的编译框架。其核心是 SkIR (https://huggingface.co/papers?q=SkIR)——一种强类型的 intermediate representation (https://huggingface.co/papers?q=intermediate%20representation),它将技能语义与平台特定的格式解耦,从而支持在异构的 agent frameworks (https://huggingface.co/papers?q=agent%20frameworks) 上进行可移植部署。围绕该 IR,一个 compile-time Analyzer (https://huggingface.co/papers?q=compile-time%20Analyzer) 在部署前通过 Anti-Skill Injection (https://huggingface.co/papers?q=Anti-Skill%20Injection) 强制执行安全约束。通过四阶段流水线,SkCC (https://huggingface.co/papers?q=SkCC) 将适配复杂度从 O(m × n) 降低至 O(m + n)。在 SkillsBench (https://huggingface.co/papers?q=SkillsBench) 上的实验表明,编译后的技能始终优于原始版本,在 Claude Code 上的通过率从 21.1% 提升至 33.3%,在 Kimi CLI 上从 35.1% 提升至 48.7%,同时实现了低于 10ms 的编译延迟、94.8% 的主动安全触发率,以及跨平台 10-46% 的 runtime token savings (https://huggingface.co/papers?q=runtime%20token%20savings)。
查看 arXiv 页面 (https://arxiv.org/abs/2605.03353) 查看 PDF (https://arxiv.org/pdf/2605.03353) 项目页面 (https://skcc.nexa-lang.com/) GitHub4 (https://github.com/Nexa-Language/Skill-Compiler) 添加到合集 (https://huggingface.co/login?next=%2Fpapers%2F2605.03353)
在你的 agent 中获取本论文:
hf papers read 2605.03353
尚未安装最新版 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型 0
暂无模型链接本论文
在模型的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。
引用本论文的数据集 0
暂无数据集链接本论文
在数据集的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。
引用本论文的 Space 0
暂无 Space 链接本论文
在 Space 的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。
包含本论文的合集 1
相似文章
SkillLens:面向成本高效型大模型智能体的自适应多粒度技能复用
本文提出了 SkillLens,这是一种用于大模型智能体自适应多粒度技能复用的分层框架,在基准任务中展示了更高的准确性和成本效益。
SkillOS:面向自进化智能体的技能策展学习
本文介绍了 SkillOS,这是一种强化学习框架,使大型语言模型智能体能够学习用于自进化的长期技能策展策略,从而提升任务性能与泛化能力。
SkillMaster:迈向大语言模型智能体的自主技能掌握
本文介绍了 SkillMaster,一种训练框架,使大语言模型智能体能够通过轨迹知情审查和反事实效用评估,自主地创建、优化和选择技能。
SkillGen:经过验证的推理时代理技能合成
本文介绍了 SkillGen,这是一个多智能体框架,通过对比成功和失败的轨迹来合成和验证可复用的推理时大语言模型(LLM)代理技能。该方法确保技能可审计,并通过实证验证其对代理性能具有净正面影响。
@tom_doerr: 从 200,000 项技能构建代理 https://github.com/ynulihao/AgentSkillOS…
AgentSkillOS 是一个开源框架,使开发者能够从超过 200,000 项可用技能中检索和编排流水线来构建 AI 代理。