@rauchg: Mythos / Sol 的网络安全能力在攻防两端同样有用。如果对手…
摘要
deepsec 是一个基于代理的漏洞扫描器,利用前沿AI模型审查大型代码库,发现难以检测的安全问题。它可以本地运行或在你自己的基础设施上运行,支持并行扫描、恢复功能以及可自定义的匹配器。
查看缓存全文
缓存时间: 2026/06/28 05:56
Mythos / Sol 网络安全能力在进攻与防御场景下同样有效。若对手掌握了等效的进攻能力,将会对尚未察觉潜在漏洞的美国公司构成严重威胁。同时,我强烈建议使用 deepsec[1] 或类似工具,配合现有前沿模型运行。[1] https://github.com/vercel-labs/deepsec…
vercel-labs/deepsec
来源:https://github.com/vercel-labs/deepsec
deepsec
deepsec 是一个由 agent 驱动的漏洞扫描器,可在自有基础设施中运行,针对现有大型仓库中的全部代码进行按需审查,并已针对性能优化。
deepsec 旨在发现应用程序中长期潜伏、难以定位的问题。它配置为以最大思考级别使用最佳模型,这意味着对大型代码库进行扫描可能花费数千甚至数万美元。我们的客户发现,考虑到他们能如此迅速地修补原本可能无法修复的漏洞,这笔成本是值得的。
对于大型代码库,工作会并行分发到多台工作机上。如果运行过程中被中断或中途出错,只需重新运行相同的命令——deepsec 会从中断处继续,跳过已分析的文件,仅处理剩余部分。
开始使用
导航到要扫描的仓库根目录,然后:
``bash npx deepsec init # 创建 .deepsec/ 并将此仓库作为第一个项目 cd .deepsec pnpm install # 从 npm 安装 deepsec
按照 init 输出的说明继续操作
``
现在让你的编码 agent 引导安装。打开你选择的 agent 并提示:
阅读
.deepsec/node_modules/deepsec/SKILL.md了解该工具。然后阅读.deepsec/data/<project>/SETUP.md并按照说明操作:浏览此仓库的 README、任何 AGENTS.md/CLAUDE.md 以及少量代表性代码文件,然后替换.deepsec/data/<project>/INFO.md中的每个部分。保持简短——总共 50-100 行。每个部分选 3-5 个示例,不要穷举。命名基本单元(如认证助手、中间件),但不要行号。跳过通用 CWE 类别——内置匹配器已覆盖。只涵盖项目特定的内容。INFO.md 会注入到每个扫描批次中;冗长的上下文会稀释信号。
然后从 .deepsec/ 内部扫描:
bash pnpm deepsec scan pnpm deepsec process pnpm deepsec revalidate # 可选,降低误报率 pnpm deepsec export --format md-dir --out ./findings
如果你觉得 deepsec 应该查看代码的更多部分,可以给它提供编写匹配器文档,以在代码库中找到更多有价值的起点。
文档
- docs/getting-started.md — 首次扫描演练
- docs/reviewing-changes.md —
process --diff用于 PR 审查和 CI 门控 - docs/supported-tech.md — deepsec 开箱即用的框架和生态系统
- docs/writing-matchers.md — 提示你的编码 agent 扩展匹配器集
- docs/configuration.md —
deepsec.config.ts参考 - docs/plugins.md — 插件编写
- docs/models.md — 模型选择、默认值、拒绝、未来模型
- docs/vercel-setup.md — AI Gateway + Vercel Sandbox 密钥/令牌
- docs/architecture.md — 管道内部结构
- docs/data-layout.md —
data/模式(FileRecord、RunMeta 等) - docs/faq.md — 成本、模型选择、沙盒模式、误报率
- samples/ — 可直接复用的起点(目前包括
webapp/) - CONTRIBUTING.md — 仓库结构、开发工作流
AI 提供商
在本地运行时,如果本机已登录,deepsec 会回退到你现有的 claude / codex 订阅。订阅(Claude Pro/Max、ChatGPT Plus)对于评估 deepsec 很有用,但通常没有足够的余量来完成完整的仓库扫描。对于实际扫描,请使用 Vercel AI Gateway。一个密钥可同时覆盖 Claude 和 Codex,并且网关的默认配额针对高并发研究而设置。
AI_GATEWAY_API_KEY=vck_...
参见 docs/vercel-setup.md 了解如何获取密钥以及 Vercel Sandbox 设置。
要绕过网关,请显式设置 ANTHROPIC_AUTH_TOKEN + ANTHROPIC_BASE_URL(或 OpenAI 对应的环境变量)。显式值始终优先于 AI_GATEWAY_API_KEY 扩展。如果 process 或 revalidate 运行因上游凭据配额或积分耗尽而停止,deepsec 会优雅地停止并告知你补充位置。之后重新运行相同的命令,它会从中断处继续。
分布式执行(可选)
大型单体仓库可以将工作分发给 Vercel Sandbox (https://vercel.com/docs/vercel-sandbox) 微虚拟机:
bash pnpm deepsec sandbox process --project-id my-app --sandboxes 10 --concurrency 4
需要 Vercel 账户。本地工作树会被打包并上传;.git 会被排除。支持 OIDC 令牌(本地)和访问令牌(CI)——参见 docs/vercel-setup.md。
deepsec 自身的安全模型
请将 deepsec 视为一个对其运行环境具有完全 shell 访问权限的编码 agent。它被设计为在受信任的输入(你的源代码)上运行,但你仍可能担心因外部依赖或供应商代码导致的提示注入。在沙盒中运行(见上文)确实能大幅减少潜在风险:
- 编码 agent 的 API 密钥在沙盒之外注入,因此无法被窃取
- 对于工作沙盒,沙盒的网络出口仅限于编码 agent 主机(引导过程中允许出口,但不运行编码 agent)
工作流参考
| 命令 | 作用 |
|---|---|
scan | 使用正则匹配器查找候选位置(快速,无 AI) |
process | AI 调查;输出发现项和建议 |
process --diff | PR 模式:只扫描并调查在 diff 中发生变更的文件 |
triage | 轻量级 P0/P1/P2 分类(更便宜的模型) |
revalidate | 重新检查现有发现项;检查 git 历史中的修复 |
enrich | 添加 git 提交者信息以及(通过插件)所有权数据 |
report | 单个项目的 Markdown + JSON 摘要 |
export | 按发现项输出 JSON 或 Markdown 文件目录 |
metrics | 跨项目统计:严重级别、漏洞类型、真阳性 |
status | 项目镜像的快照 |
sandbox <cmd> | 在 Vercel Sandbox 微虚拟机上运行以上任意命令 |
许可证
Apache 2.0。参见 LICENSE 和 NOTICE。
Polymarket (@Polymarket): 最新消息:智谱 AI 的新中文 AI 模型据称在发现安全漏洞方面的表现与 Claude Mythos 相当。
相似文章
@logangraham: 很多人一直在关注Mythos、Glasswing以及我们/合作伙伴正在修复的漏洞。今天,我很兴奋……
Anthropic的Claude Mythos Preview模型已经过XBOW和英国AISI的评估,展示了前所未有的自主网络安全能力,包括解决端到端网络靶场以及发现数千个漏洞。该公告强调需要为网络安全领域快速发展的AI能力做好准备。
它能媲美Mythos吗?
作者测试其他AI模型是否能匹配Mythos在寻找安全漏洞方面的卓越能力,建立了一个由Mythos发现的漏洞基准,并测试了像Opus这样的模型。初步结果表明Mythos可能具有独特的能力。
微软多智能体AI系统在网络安全基准测试中超越Anthropic的Mythos(3分钟阅读)
微软的MDASH多智能体AI系统,利用超过100个专业智能体,在CyberGym网络安全基准测试中超越了Anthropic的Mythos,能够有效发现并确认真实世界的软件漏洞。
@heyshrutimishra: We've been watching the wrong AI story. While the timeline keeps debating whether Mythos is real, hyped, or just well-m…
A thread contrasts the hype around AI security startup Mythos with 360's practical achievement of autonomously discovering 23 vulnerabilities (including two criticals) in the OpenClaw ecosystem, highlighting the real direction of AI security.
Claude Mythos 开启网络安全的潘多拉魔盒
Anthropic 发布了 Claude Mythos,这是一款能力极强的 AI 模型,旨在自动发现操作系统、浏览器和软件库中的安全漏洞。出于双重用途风险的考虑,该模型最初仅通过 Project Glasswing 向部分企业和开源合作伙伴开放,此次发布引发了业界关于 AI 安全能力与企业营销策略的广泛争论。