真实性问题
摘要
文章表达了对AI生成内容污染互联网的长期影响的担忧,这使得验证真实性和与现实依据变得困难,并对未来AI治理的系统造成严重后果。
我真正担心的是,智能体技术能够以怎样的规模生产产物,这些产物随后被贡献到它们所引用的通用语料库中。互联网和其他公共数据库中的AI生成内容越多,AI就越是在自我训练中引用这些语料库。这现在似乎不是问题,但在10到15年后,当数十亿个AI生成的产物被扩散并贡献到互联网或人类相关数据库这一通用参考语料库时,我们验证这些引用是否确实基于现实的能力会发生什么?如果人类或相关工具被构建出来,在技术栈中引入归因和可审计性,那么这不一定是问题。否则,我认为我们将面临更严重的风险。我们将无法有效判断某个信息资源是AI生成的还是人类生成的,更不用说其真实性和现实依据了。因此,我们无法辨别符号产物之间的统计关系是否基于真实的基准。这现在不是问题。但在未来AI管理交通、武器系统、电网和通信设备的状态下,会带来严重后果。即使无法归因的AI生成不直接影响这些系统,它也会影响构建、维护和改进这些系统的生产系统(公司)所做的决策。这只是威胁向量之一。故意将不真实且无法验证的引用引入语料库会导致更大的问题,即无法判断某个信息资源是否由人类生成,以及人类引入该信息资源到信息资源池时的意图(如果有的话)。从动态角度来看,我担心的具体比率是:内容生成速度 / 内容验证速度,乘以或加上 内容生成难度 / 内容验证难度。
相似文章
人们现在对AI的感受如何。
本文探讨了围绕AI的社会紧张局势,AI生成的内容越来越多地被当作性格证据,导致真实性危机和地位焦虑,因为人类努力失去了感知价值。
如果网上关于AI的炒作和恐惧大部分其实是由AI自己生成的,那会有多酷/令人担忧?
本文探讨了一个令人不安的可能性:网上关于AI的许多炒作和恐惧本身就是由AI生成的,模糊了真实人类感知与算法叙事塑造之间的界限。
AI垃圾内容正在成为一场溯源危机,而不仅仅是内容质量的问题
本文认为,AI生成内容(垃圾内容)的大量涌现正引发一场溯源危机,信息的来源和可靠性受到破坏,文中以自动外联误导向和虚假互动等例子加以说明。
非主流观点:随着AI越来越好,人们不会“回归真实”
文章认为,当AI生成的内容与互动无处不在时,大多数人会接受“够用”的合成体验,而不会追求真实,就像超加工食品的普及一样。
人们对AI生成内容/工作的透明度需要达到什么程度?
本文探讨了关于AI生成内容(如小说和网站)透明度的伦理问题,以及当AI被用于创意或商业工作时,消费者是否应当被告知。