新Mythos检查点展示持续进步：“在32步企业网络攻击中，我们估计人类专家需要约20小时，而此检查点在十次尝试中可完成六次完整攻击。”

Reddit r/singularity 2026/05/13 19:03 模型

checkpoint cybersecurity network-attack ai-security penetration-testing automated-attack continued-improvement

摘要

Mythos发布了一个新的检查点，能在十次尝试中完成六次32步企业网络攻击，而人类专家则需要约20小时。

暂无内容

查看原文

相似文章

Reddit r/singularity

Mythos在网络安全黑客攻击中展现了强大性能，实现了41个n-day漏洞利用中的18个，而5.5版本只有1个，开源模型则一个都没有。

Reddit r/singularity

Anthropic 的 Mythos 系统在优化训练代码方面实现了 52 倍的加速，而人类在同任务上 4-8 小时内只能实现 4 倍加速，但需要注意的是，绝对倍数在很大程度上取决于起始代码的质量。同类比较显示，过去一年中各模型的改进约为 3 倍到 52 倍。

Reddit r/ArtificialInteligence

Cloudflare对Anthropic的Mythos Preview的测试显示，该模型能够将多个低严重性漏洞串联成可用的利用代码，这是进攻性网络安全AI的一大步，同时Anthropic正准备向G20官员简报相关风险。

X AI KOLs Following

Anthropic的Claude Mythos Preview模型已经过XBOW和英国AISI的评估，展示了前所未有的自主网络安全能力，包括解决端到端网络靶场以及发现数千个漏洞。该公告强调需要为网络安全领域快速发展的AI能力做好准备。

Hacker News Top

Cloudflare 测试了 Anthropic 专为安全漏洞研究设计的 Mythos Preview 大语言模型，发现它能够将多个漏洞串联成利用链并生成可行的验证代码，这代表了相较于通用前沿模型的重大进步。