SkCC:面向跨框架 LLM 代理的便携式安全技能编译

Hugging Face Daily Papers 论文

摘要

SkCC 是一个编译框架,利用强类型中间表示实现在不同框架间可移植地部署代理技能,同时强制执行安全性,显著提升性能并减少维护负担。

LLM 代理已演变为执行复杂任务的自主系统,其中 SKILL.md 规范已成为封装代理能力的事实标准。然而,一个关键瓶颈仍然存在:不同的代理框架对提示词格式表现出显著不同的敏感性,导致高达 40% 的性能差异,而几乎所有技能仅以单一、与格式无关的 Markdown 版本存在。手动逐平台重写造成了不可持续的维护负担,而先前的审计发现超过三分之一的社区技能包含安全漏洞。为此,我们提出了 SkCC,这是一个将经典编译器设计引入代理技能开发的编译框架。其核心是 SkIR——一种强类型中间表示,它将技能语义与平台特定格式解耦,从而实现在异构代理框架间的可移植部署。围绕该中间表示,编译时分析器在部署前通过 Anti-Skill Injection 强制执行安全约束。通过四阶段流水线,SkCC 将适配复杂度从 O(m × n) 降低到 O(m + n)。在 SkillsBench 上的实验表明,编译后的技能始终优于其原始版本,将 Claude Code 上的通过率从 21.1% 提高到 33.3%,将 Kimi CLI 上的通过率从 35.1% 提高到 48.7%,同时在各平台上实现了低于 10ms 的编译延迟、94.8% 的主动安全触发率以及 10-46% 的运行时 Token 节省。
查看原文
查看缓存全文

缓存时间: 2026/05/11 14:53

论文页面 - SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents

来源:https://huggingface.co/papers/2605.03353

摘要

SkCC 是一个编译框架,它采用强类型中间表示,使智能体技能能够在不同平台上进行可移植部署,同时确保安全并提升性能。

LLM-Agents (https://huggingface.co/papers?q=LLM-Agents) 已演变为用于执行复杂任务的自主系统,其中 SKILL.md (https://huggingface.co/papers?q=SKILL.md) 规范已成为封装智能体能力的事实标准。然而,一个关键瓶颈依然存在:不同的 agent frameworks (https://huggingface.co/papers?q=agent%20frameworks) 对 prompt formatting (https://huggingface.co/papers?q=prompt%20formatting) 的敏感度差异显著,导致性能波动高达 40%,但几乎所有技能都以单一、与格式无关的 Markdown 版本存在。针对每个平台手动重写带来了难以承受的维护负担,而此前的审计发现,超过三分之一的社区技能包含 security vulnerabilities (https://huggingface.co/papers?q=security%20vulnerabilities)。为解决这一问题,我们提出了 SkCC (https://huggingface.co/papers?q=SkCC),这是一个将经典编译器设计引入智能体技能开发的编译框架。其核心是 SkIR (https://huggingface.co/papers?q=SkIR)——一种强类型的 intermediate representation (https://huggingface.co/papers?q=intermediate%20representation),它将技能语义与平台特定的格式解耦,从而支持在异构的 agent frameworks (https://huggingface.co/papers?q=agent%20frameworks) 上进行可移植部署。围绕该 IR,一个 compile-time Analyzer (https://huggingface.co/papers?q=compile-time%20Analyzer) 在部署前通过 Anti-Skill Injection (https://huggingface.co/papers?q=Anti-Skill%20Injection) 强制执行安全约束。通过四阶段流水线,SkCC (https://huggingface.co/papers?q=SkCC) 将适配复杂度从 O(m × n) 降低至 O(m + n)。在 SkillsBench (https://huggingface.co/papers?q=SkillsBench) 上的实验表明,编译后的技能始终优于原始版本,在 Claude Code 上的通过率从 21.1% 提升至 33.3%,在 Kimi CLI 上从 35.1% 提升至 48.7%,同时实现了低于 10ms 的编译延迟、94.8% 的主动安全触发率,以及跨平台 10-46% 的 runtime token savings (https://huggingface.co/papers?q=runtime%20token%20savings)。

查看 arXiv 页面 (https://arxiv.org/abs/2605.03353) 查看 PDF (https://arxiv.org/pdf/2605.03353) 项目页面 (https://skcc.nexa-lang.com/) GitHub4 (https://github.com/Nexa-Language/Skill-Compiler) 添加到合集 (https://huggingface.co/login?next=%2Fpapers%2F2605.03353)

在你的 agent 中获取本论文:

hf papers read 2605.03353

尚未安装最新版 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型 0

暂无模型链接本论文

在模型的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。

引用本论文的数据集 0

暂无数据集链接本论文

在数据集的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。

引用本论文的 Space 0

暂无 Space 链接本论文

在 Space 的 README.md 中引用 arxiv.org/abs/2605.03353 即可在此页面显示链接。

包含本论文的合集 1

相似文章

SkillGen:经过验证的推理时代理技能合成

arXiv cs.LG

本文介绍了 SkillGen,这是一个多智能体框架,通过对比成功和失败的轨迹来合成和验证可复用的推理时大语言模型(LLM)代理技能。该方法确保技能可审计,并通过实证验证其对代理性能具有净正面影响。