Dario 谈 Mythos ".. 美国政府和我的安全团队在说,不,等一下.." 和 ".. 我们都知道这些分类器可以被越狱..."

Reddit r/singularity 模型

摘要

在彭博社的一次采访中,Anthropic CEO Dario Amodei讨论了Mythos AI系统的网络能力以及谨慎的、与政府协调的发布策略,该策略优先保护防御者而非攻击者。

Bloomberg Originals几小时前在YouTube上发布了采访的完整版 https://www.youtube.com/watch?v=x2VHFgyawPE,这是他们7天前发布的采访的延长版本,其中包含了更多Dario关于Mythos的评论。标题引用的直接链接:https://youtu.be/x2VHFgyawPE?t=3213 和 https://youtu.be/x2VHFgyawPE?t=2996。转录中还包含许多其他关于Mythos的引用:"...现在要明确的是,因为事情在社交媒体上总是会被歪曲,目标并不是永远封锁这个系统。我们正在逐步尝试将其开放给更广泛的人群,最终我们相信应该向普通公众发布Mythos,但要带有强大的网络安全保障措施。" [49:35] "...这个想法是,Mythos会扫描整个代码库,并发现一些问题。有人曾在Twitter上说,'如果你把开源模型指向Mythos找到的那一行代码,它也能发现同样的问题。'" [50:58] "...所以实际上,真正在实践中有效的工作流程,而不是'好吧,我找到了Mythos发现的那一行,我找到了针,现在别人可以拿起那根针'。" [51:36] "...我要说的是,我们之所以先给防御者提供Mythos,然后再给攻击者,是为了修补所有的漏洞。" [52:14] "...我们正在努力实现那个世界,并且尽力向新的网络防御者开放Mythos。我们一直在与政府对话,非常尊重他们的建议,他们正在减缓我们开放的速度,因为他们担心反情报风险。" [52:45] "...你看,我每天都有客户打电话给我说'我想使用Mythos。'" [53:33] "...也有国家打电话给我说'我想使用Mythos。'" [53:33] "...我要说的是,现在我们处于我认为是商业领先的地位,实际上我和Daniela正在尽一切努力,进一步加强对谨慎态度的重视。这正是Mythos发布的意义所在,对吧?如果你不是领先者,很难做出这样的决定。" [54:50] "...老实说,政府非常重视Mythos。我们与Bessant部长、幕僚长Susie Wilds进行了良好的对话。我认为他们确实理解了风险的本质。Mythos帮助他们更具体地感受到了这些风险的存在。" [59:00] "...我现在担心的是,一些落后的模型存在风险。我们拥有Mythos级别的网络能力,12个月后我们将拥有更好的网络能力,但Mythos级别的网络能力可能任何人都可以下载。" [01:01:32]
查看原文

相似文章