ClawHub安全信号：当VirusTotal、静态分析与SkillSpector存在分歧时

Hugging Face Daily Papers 2026/05/31 23:20 论文

agent-skills security scanner-disagreement dataset ai-safety academic-research

摘要

本文研究AI智能体技能的安全扫描器分歧，发现VirusTotal、静态分析和NVIDIA SkillSpector标记不同的技能，且重叠极少。它发布了一个超过67,000个技能版本的脱敏数据集，以支持分层安全治理的进一步研究。

智能体技能通过可重用的指令、工具、脚本、参考和工作流扩展AI智能体，建立了一个既不同于模型安全也不同于传统包恶意软件检测的安全边界。ClawHub安全信号是一个包含67,453个最新公共OpenClaw技能版本的脱敏数据集。每一行将经过脱敏处理的SKILL.md内容和清理后的捆绑文件（如果存在）与ClawScan注册表的最终判定以及来自三个扫描器族（VirusTotal、静态启发式分析和NVIDIA SkillSpector）的证据配对。我们并未估算恶意技能的普遍性，而是研究扫描器分歧。三个扫描器很少标记相同的技能：任意两个扫描器在其合并阳性结果上的重叠最多为10.4%，只有0.69%的技能被三个扫描器同时标记，而81.9%被标记的技能仅由单个扫描器识别。这种分歧是按攻击面结构化的。SkillSpector（提出语义级的智能体风险建议而非恶意软件信誉信号）在25,504个可疑行中有19,209个阳性（75.3%），但在206个恶意行中仅有14个阳性（6.8%）。恶意判定区域则呈现相反的分布：206个恶意行中有150个（72.8%）对VirusTotal呈阳性，与捆绑代码的恶意软件证据一致。这些结果表明，智能体技能安全需要分层治理，而非单个扫描器的放行/阻止决策。该语料库以脱敏的银标准数据集形式发布：标签是注册表的自动判定，而非人工标注的真实答案，该发布是一个早期的、带版本号的快照，旨在支持社区，同时开发人工标注的子集。鼓励开展进一步研究，包括针对技能安全分类的定制模型。

查看原文

查看缓存全文

缓存时间: 2026/06/03 07:36

论文页面 - ClawHub 安全信号：当 VirusTotal、静态分析与 SkillSpector 意见相左时

来源：https://huggingface.co/papers/2606.01494

摘要

智能体技能需要分层安全治理，原因在于扫描器之间的分歧，研究结果显示不同扫描器类型和攻击面上的检测率存在差异。

智能体技能通过可复用的指令、工具、脚本、参考材料和工作流扩展了 AI 智能体，建立了一个既不同于模型安全也不同于传统软件包恶意软件检测的安全边界。ClawHub 安全信号（https://huggingface.co/papers?q=ClawHub%20Security%20Signals）是一个经过脱敏处理的数据集，包含 67,453 个最新的公开 OpenClaw 技能版本。每一行数据包含经过编辑的 SKILL.md 内容（如适用）和脱敏后的捆绑文件，以及最终的 ClawScan 注册表裁决（https://huggingface.co/papers?q=ClawScan%20registry%20verdict）和来自三个扫描器家族的证据：VirusTotal（https://huggingface.co/papers?q=VirusTotal）、静态启发式分析（https://huggingface.co/papers?q=static%20heuristic%20analysis）和 NVIDIA SkillSpector（https://huggingface.co/papers?q=NVIDIA%20SkillSpector）。我们的研究并非估计恶意技能的出现率，而是研究扫描器之间的分歧。三个扫描器很少同时标记相同的技能：任意两个扫描器在其共同阳性结果上的重叠率最多为 10.4%，只有 0.69% 的技能被三个扫描器同时标记，而 81.9% 的被标记技能仅由一个扫描器识别。这种分歧与攻击面相关。SkillSpector 主要发出语义性智能体风险提示（https://huggingface.co/papers?q=semantic%20agentic-risk%20advisories）而非恶意软件信誉信号（https://huggingface.co/papers?q=malware-reputation%20signals），它在 25,504 个可疑行中有 19,209 行呈阳性（75.3%），但在 206 个恶意行中仅有 14 行呈阳性（6.8%）。恶意裁决区域则呈现相反特征：206 个恶意行中有 150 行（72.8%）被 VirusTotal（https://huggingface.co/papers?q=VirusTotal）标记为阳性，这与捆绑代码的恶意软件证据一致。这些结果表明，智能体技能的安全需要分层治理，而非单一扫描器的允许/阻止决策。该语料库作为一份脱敏的银标准数据集发布：标签为注册表的自动裁决结果，并非人工标注的真实数据；此次发布是一个早期、有版本的快照，旨在在开发人工标注子集期间支持社区。我们鼓励进一步研究，包括针对技能安全分类的定制模型。

查看 arXiv 页面（https://arxiv.org/abs/2606.01494）查看 PDF（https://arxiv.org/pdf/2606.01494）项目页面（https://huggingface.co/datasets/OpenClaw/clawhub-security-signals）添加至收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.01494）

在您的智能体中获取此论文：

hf papers read 2606\.01494

没有最新 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

无模型链接到此论文

在模型 README.md 中引用 arxiv.org/abs/2606.01494 即可将其从此页面链接。

引用此论文的数据集1

OpenClaw/clawhub-security-signals 查看器 • 更新于约 2 小时前 • 67.5k • 84 • 24（https://huggingface.co/datasets/OpenClaw/clawhub-security-signals）

引用此论文的 Space0

无 Space 链接到此论文

在 Space README.md 中引用 arxiv.org/abs/2606.01494 即可将其从此页面链接。

包含此论文的收藏集0

无收藏集包含此论文

将本论文添加至收藏集（https://huggingface.co/new-collection）即可从此页面链接。

ClawHub安全信号：当VirusTotal、静态分析与SkillSpector存在分歧时

论文页面 - ClawHub 安全信号：当 VirusTotal、静态分析与 SkillSpector 意见相左时

摘要

引用此论文的模型0

引用此论文的数据集1

OpenClaw/clawhub-security-signals 查看器 • 更新于约 2 小时前 • 67.5k • 84 • 24（https://huggingface.co/datasets/OpenClaw/clawhub-security-signals）

引用此论文的 Space0

包含此论文的收藏集0

相似文章

NVIDIA/SkillSpector

Unit 42 发现 5 个恶意技能，绕过 ClawScan 和 VirusTotal 检测

@dani_avila7: NVIDIA 恰好构建了我保护 agent 技能所需的东西 https://github.com/nvidia/skillspector… 将其添加为 GitHub…

为你的OpenClaw代理技能提供运行前安全保障

Skill Inspector

提交意见反馈