新Mythos检查点展示持续进步:“在32步企业网络攻击中,我们估计人类专家需要约20小时,而此检查点在十次尝试中可完成六次完整攻击。”

Reddit r/singularity 模型

摘要

Mythos发布了一个新的检查点,能在十次尝试中完成六次32步企业网络攻击,而人类专家则需要约20小时。

暂无内容
查看原文

相似文章

Project Glasswing: Mythos 的启示

Hacker News Top

Cloudflare 测试了 Anthropic 专为安全漏洞研究设计的 Mythos Preview 大语言模型,发现它能够将多个漏洞串联成利用链并生成可行的验证代码,这代表了相较于通用前沿模型的重大进步。