标签
一位没有编程背景的钢琴老师,在5个月内自学编程,推出了testyourllm.com——一个自主AI红队测试工具,能够攻击任何兼容OpenAI的LLM端点。在实时测试中,攻击型AI“Tron”首次尝试就攻破了Llama 3.3 70B。
《金融时报》重点介绍了Heretic,这是一个GitHub工具,可以在几分钟内移除Meta的Llama 3.3模型的护栏。该工具已创建超过3,500个“去审查”模型,并获得了1300万次下载,引起了主流关注。