AI 新闻:让所有人震惊的模型来了!

YouTube AI Channels 模型

摘要

Anthropic 尚未发布的 Claude Mythos 模型展现出顶级黑客与漏洞挖掘能力,公司正与多家科技巨头进行非公开预览,以便在正式发布前先修复软件漏洞。

本周你可能错过的 AI 新闻(以及你绝对没错过的那些)——订阅 https://futuretools.io/ 的通讯,让 AI 资讯直达邮箱。 探索更多: 🛠️ 探索……
查看原文
查看缓存全文

缓存时间: 2026/04/21 15:35

TL;DR:Anthropic 尚未发布的 Claude Mythos 模型在黑客攻击方面过于强大,公司决定暂不公开,仅向少数安全团队提供内测,以便在恶意使用者掌握前抢先修复软件漏洞。 ## Claude Mythos 与 Project Glasswing ### Claude Mythos 是什么? Anthropic 内部代号“终极前沿”模型。245 页系统卡写道: > “Claude Mythos 是一款尚未发布的通用前沿模型,它揭示了一个严峻现实:AI 编码能力已进化到能够发现并利用软件漏洞,水平堪比顶尖人类黑客。” 基准快照: - **网络安全漏洞复现**:Opus 4.6 66.6 % → **Mythos 83.1 %** - **SWEBench Pro**:比 Opus 4.6 高 24 个百分点 - **Terminal Bench**:高 17 个百分点 - **SWEBench Multimodal**:分数**翻倍** 该模型: - 在 OpenBSD 中发现了一个**存在 27 年的漏洞** - 挖出 FFmpeg **16 年旧 bug** - 串联多个 Linux 内核缺陷——全球大部分服务器都在跑的软件 Anthropic 结论: “这些能力可能很快扩散到不负责任的行为者手中,带来严重的经济、公共安全和国家安全影响。” ### Project Glasswing Anthropic 未发布 Mythos,而是向 Apple、Microsoft、NVIDIA、Cisco、CrowdStrike 等安全团队开启私测,让大厂在等效模型流入黑产前先行修洞。 Anthropic 视频原话: “我们并未专门训练它做网络安全;只是把它训练成代码高手,副作用就是顶级黑客水平。” ### 似曾相识还是真谨慎? 2019 年 GPT-2 “太危险不敢发”事后看像炒作。这次感觉不同:Anthropic 先把“万能钥匙”交给竞争对手,请他们先锁门。无论是否算负责任 AI,只要 iPhone、Windows、Chrome 在下一轮蠕虫爆发前变得更硬,用户就赚了。 ## 两款值得关注的公开新模型 ### Meta Muse Spark - Meta 全新 **Super Intelligence Lab** 首款模型(Scale AI 的 Alexander Wang 掌舵,Yann LeCun 顾问) - **闭源**——Meta 的开放路线暂停 - 基准表现均衡,**token 效率最佳**,推理便宜 - 已集成至 Meta AI (https://ai.meta.com),API 需排队申请 ### Zhipu GLM-5.1 - **MIT 协议**发布,权重已上架 Hugging Face (https://huggingface.co/THUDM/glm-5.1-32b) - **SWEBench Pro 58.4 %**,略超 GPT-5.4 (57.7 %) 与 Claude Opus 4.6 (57.3 %) - 可本地部署、可微调,**首个开源模型**跻身顶级代码性能 - 尚未出圈——想要开源大体重磅,盯这波即可 ## 快讯速览 - **Gemini** 现已生成 **3D 模型**,并推出类 Notebook LM 的“Gemini Notebooks” - **Runway** 发布 **Seedance 2.0**,AI 舞蹈视频更长更流畅 - **CapCut** 上线生成式贴纸与一键风格迁移 - **HeyGen** 推出 **Forever Avatar V**,一次训练,终身可用 - **OpenAI** 悄悄上线 **$200 ChatGPT Pro**,速率限制更高 - **Claude** 为企业账户推出**托管式智能体** 一句话:能黑你代码的模型先锁起来,更便宜的开源权重 challenger 正加速赶来。早打补丁,多测试,盯紧下一波。

相似文章

Anthropic 新模型一个月内发现超一万个安全漏洞

Reddit r/ArtificialInteligence

Anthropic 的新 AI 模型 Claude Mythos 在一个月内识别出全球系统软件中超过一万个高危和严重安全漏洞,其误报率优于人类测试人员,显著推动了 AI 驱动的网络安全。

Claude Mythos 开启网络安全的潘多拉魔盒

Reddit r/artificial

Anthropic 发布了 Claude Mythos,这是一款能力极强的 AI 模型,旨在自动发现操作系统、浏览器和软件库中的安全漏洞。出于双重用途风险的考虑,该模型最初仅通过 Project Glasswing 向部分企业和开源合作伙伴开放,此次发布引发了业界关于 AI 安全能力与企业营销策略的广泛争论。