@rauchg: Mythos / Sol 的网络安全能力在攻防两端同样有用。如果对手…

X AI KOLs Following 2026/06/28 01:46 工具

cybersecurity vulnerability-scanner deepsec ai-agent open-source code-review

摘要

deepsec 是一个基于代理的漏洞扫描器，利用前沿AI模型审查大型代码库，发现难以检测的安全问题。它可以本地运行或在你自己的基础设施上运行，支持并行扫描、恢复功能以及可自定义的匹配器。

Mythos / Sol 的网络安全能力在攻防两端同样有用。如果对手获得了同等的进攻能力，将对那些仍未意识到潜在漏洞的美国公司构成严重威胁。与此同时，我强烈建议使用 deepsec[1] 或类似的工具，配合现有的前沿模型进行运行。 [1] https://github.com/vercel-labs/deepsec…

查看原文

查看缓存全文

缓存时间: 2026/06/28 05:56

Mythos / Sol 网络安全能力在进攻与防御场景下同样有效。若对手掌握了等效的进攻能力，将会对尚未察觉潜在漏洞的美国公司构成严重威胁。同时，我强烈建议使用 deepsec[1] 或类似工具，配合现有前沿模型运行。[1] https://github.com/vercel-labs/deepsec…

vercel-labs/deepsec

来源：https://github.com/vercel-labs/deepsec

deepsec

deepsec 是一个由 agent 驱动的漏洞扫描器，可在自有基础设施中运行，针对现有大型仓库中的全部代码进行按需审查，并已针对性能优化。

deepsec 旨在发现应用程序中长期潜伏、难以定位的问题。它配置为以最大思考级别使用最佳模型，这意味着对大型代码库进行扫描可能花费数千甚至数万美元。我们的客户发现，考虑到他们能如此迅速地修补原本可能无法修复的漏洞，这笔成本是值得的。

对于大型代码库，工作会并行分发到多台工作机上。如果运行过程中被中断或中途出错，只需重新运行相同的命令——deepsec 会从中断处继续，跳过已分析的文件，仅处理剩余部分。

开始使用

导航到要扫描的仓库根目录，然后：

``bash npx deepsec init # 创建 .deepsec/ 并将此仓库作为第一个项目 cd .deepsec pnpm install # 从 npm 安装 deepsec

按照 `init` 输出的说明继续操作

现在让你的编码 agent 引导安装。打开你选择的 agent 并提示：

阅读 .deepsec/node_modules/deepsec/SKILL.md 了解该工具。然后阅读 .deepsec/data/<project>/SETUP.md 并按照说明操作：浏览此仓库的 README、任何 AGENTS.md/CLAUDE.md 以及少量代表性代码文件，然后替换 .deepsec/data/<project>/INFO.md 中的每个部分。

保持简短——总共 50-100 行。每个部分选 3-5 个示例，不要穷举。命名基本单元（如认证助手、中间件），但不要行号。跳过通用 CWE 类别——内置匹配器已覆盖。只涵盖项目特定的内容。INFO.md 会注入到每个扫描批次中；冗长的上下文会稀释信号。

然后从 .deepsec/ 内部扫描：

bash pnpm deepsec scan pnpm deepsec process pnpm deepsec revalidate # 可选，降低误报率 pnpm deepsec export --format md-dir --out ./findings

如果你觉得 deepsec 应该查看代码的更多部分，可以给它提供编写匹配器文档，以在代码库中找到更多有价值的起点。

文档

docs/getting-started.md — 首次扫描演练
docs/reviewing-changes.md — process --diff 用于 PR 审查和 CI 门控
docs/supported-tech.md — deepsec 开箱即用的框架和生态系统
docs/writing-matchers.md — 提示你的编码 agent 扩展匹配器集
docs/configuration.md — deepsec.config.ts 参考
docs/plugins.md — 插件编写
docs/models.md — 模型选择、默认值、拒绝、未来模型
docs/vercel-setup.md — AI Gateway + Vercel Sandbox 密钥/令牌
docs/architecture.md — 管道内部结构
docs/data-layout.md — data/ 模式（FileRecord、RunMeta 等）
docs/faq.md — 成本、模型选择、沙盒模式、误报率
samples/ — 可直接复用的起点（目前包括 webapp/）
CONTRIBUTING.md — 仓库结构、开发工作流

AI 提供商

在本地运行时，如果本机已登录，deepsec 会回退到你现有的 claude / codex 订阅。订阅（Claude Pro/Max、ChatGPT Plus）对于评估 deepsec 很有用，但通常没有足够的余量来完成完整的仓库扫描。对于实际扫描，请使用 Vercel AI Gateway。一个密钥可同时覆盖 Claude 和 Codex，并且网关的默认配额针对高并发研究而设置。

AI_GATEWAY_API_KEY=vck_...

参见 docs/vercel-setup.md 了解如何获取密钥以及 Vercel Sandbox 设置。

要绕过网关，请显式设置 ANTHROPIC_AUTH_TOKEN + ANTHROPIC_BASE_URL（或 OpenAI 对应的环境变量）。显式值始终优先于 AI_GATEWAY_API_KEY 扩展。如果 process 或 revalidate 运行因上游凭据配额或积分耗尽而停止，deepsec 会优雅地停止并告知你补充位置。之后重新运行相同的命令，它会从中断处继续。

分布式执行（可选）

大型单体仓库可以将工作分发给 Vercel Sandbox (https://vercel.com/docs/vercel-sandbox) 微虚拟机：

bash pnpm deepsec sandbox process --project-id my-app --sandboxes 10 --concurrency 4

需要 Vercel 账户。本地工作树会被打包并上传；.git 会被排除。支持 OIDC 令牌（本地）和访问令牌（CI）——参见 docs/vercel-setup.md。

deepsec 自身的安全模型

请将 deepsec 视为一个对其运行环境具有完全 shell 访问权限的编码 agent。它被设计为在受信任的输入（你的源代码）上运行，但你仍可能担心因外部依赖或供应商代码导致的提示注入。在沙盒中运行（见上文）确实能大幅减少潜在风险：

编码 agent 的 API 密钥在沙盒之外注入，因此无法被窃取
对于工作沙盒，沙盒的网络出口仅限于编码 agent 主机（引导过程中允许出口，但不运行编码 agent）

工作流参考

命令	作用
`scan`	使用正则匹配器查找候选位置（快速，无 AI）
`process`	AI 调查；输出发现项和建议
`process --diff`	PR 模式：只扫描并调查在 diff 中发生变更的文件
`triage`	轻量级 P0/P1/P2 分类（更便宜的模型）
`revalidate`	重新检查现有发现项；检查 git 历史中的修复
`enrich`	添加 git 提交者信息以及（通过插件）所有权数据
`report`	单个项目的 Markdown + JSON 摘要
`export`	按发现项输出 JSON 或 Markdown 文件目录
`metrics`	跨项目统计：严重级别、漏洞类型、真阳性
`status`	项目镜像的快照
`sandbox <cmd>`	在 Vercel Sandbox 微虚拟机上运行以上任意命令

许可证

Apache 2.0。参见 LICENSE 和 NOTICE。

Polymarket (@Polymarket): 最新消息：智谱 AI 的新中文 AI 模型据称在发现安全漏洞方面的表现与 Claude Mythos 相当。

相似文章

@logangraham: 很多人一直在关注Mythos、Glasswing以及我们/合作伙伴正在修复的漏洞。今天，我很兴奋……

X AI KOLs Following

Anthropic的Claude Mythos Preview模型已经过XBOW和英国AISI的评估，展示了前所未有的自主网络安全能力，包括解决端到端网络靶场以及发现数千个漏洞。该公告强调需要为网络安全领域快速发展的AI能力做好准备。

它能媲美Mythos吗？

Hacker News Top

作者测试其他AI模型是否能匹配Mythos在寻找安全漏洞方面的卓越能力，建立了一个由Mythos发现的漏洞基准，并测试了像Opus这样的模型。初步结果表明Mythos可能具有独特的能力。

微软多智能体AI系统在网络安全基准测试中超越Anthropic的Mythos（3分钟阅读）

TLDR AI

微软的MDASH多智能体AI系统，利用超过100个专业智能体，在CyberGym网络安全基准测试中超越了Anthropic的Mythos，能够有效发现并确认真实世界的软件漏洞。

@heyshrutimishra: We've been watching the wrong AI story. While the timeline keeps debating whether Mythos is real, hyped, or just well-m…