《金融时报》发表了一篇关于Heretic的文章
摘要
《金融时报》重点介绍了Heretic,这是一个GitHub工具,可以在几分钟内移除Meta的Llama 3.3模型的护栏。该工具已创建超过3,500个“去审查”模型,并获得了1300万次下载,引起了主流关注。
https://www.ft.com/content/5630ed79-a263-41ed-9a1a-321617ae310e “《金融时报》能够使用Heretic——一个在流行的代码仓库GitHub上可用的工具——在不到10分钟内移除Meta的Llama 3.3模型的护栏,无需任何专业硬件。” “Heretic的创建者Philipp Emanuel Weidmann告诉《金融时报》,他的软件自去年发布以来已被用于创建超过3,500个“去审查”模型,并且使用该工具创建的修改系统已被下载1300万次。” 这是我最近收到的多次媒体询问中的第一次,因为Heretic和未经审查的语言模型正获得主流关注。 **请注意,我是一名数学家和工程师,而不是“影响者”或政治家,我对在科学技术圈子之外出名毫无兴趣(实际上是负兴趣)。** 然而,我前段时间意识到,拒绝这些询问只会让对话完全被那些大惊小怪的伪君子所控制。 我正尽最大努力维持这个项目,确保不受限制的模型对所有人仍然可用。更多更新即将到来。Cheers, p-e-w
相似文章
Heretic 已收到 Meta, Inc. 的法律通知
Meta 向 Heretic 项目发出法律通知,涉及对其 Llama AI 模型的衍生作品,促使该项目移除权重并宣布计划通过官方 Codeberg 镜像实现基础设施多样化。
LLM去审查工具Heretic收到Facebook(“Meta”)的法律通知
Heretic LLM去审查项目收到Meta的法律通知,导致衍生Llama模型被移除;该项目已迁移至Codeberg镜像,并计划采取技术措施以保持访问权限。
⚠️ Meta的AI安全过滤器在不到10分钟内被移除
《金融时报》与AI安全组织Alice的一项联合测试显示,使用名为Heretic的免费工具,可以在10分钟内移除Meta的Llama 3.3和Google的Gemma 4模型上的安全过滤器,凸显了监管开源AI安全性的难度。
AI 新闻:让所有人震惊的模型来了!
Anthropic 尚未发布的 Claude Mythos 模型展现出顶级黑客与漏洞挖掘能力,公司正与多家科技巨头进行非公开预览,以便在正式发布前先修复软件漏洞。
Cloudflare 刚刚发布了他们针对自有50多个仓库运行 Anthropic 的 Mythos Preview 后所发现的结果,值得一读
Cloudflare 分享了他们使用 Anthropic 的 Mythos Preview 模型的经验,该模型自主发现了主要操作系统和网络浏览器中的高严重性漏洞。该模型在串联利用原语时展现出高级推理能力,但安全护栏不一致,凸显了在公开发布前需要加强防护措施。