标签
本文揭示,语法约束解码(GCD)可被利用为一种越狱攻击(CodeSpear),诱使大语言模型生成恶意代码,并提出一种防御方法(CodeShield),在此类攻击下仍能保持安全。
Java库jqwik的维护者Johannes Link添加了恶意提示注入,以干扰AI对该库的使用,引发了关于AI伦理和开源维护者权利的辩论。