真实性问题

Reddit r/artificial 2026/06/19 21:53 新闻

ai-generated-content authenticity verification ai-risk agentic-ai information-integrity

摘要

文章表达了对AI生成内容污染互联网的长期影响的担忧，这使得验证真实性和与现实依据变得困难，并对未来AI治理的系统造成严重后果。

我真正担心的是，智能体技术能够以怎样的规模生产产物，这些产物随后被贡献到它们所引用的通用语料库中。互联网和其他公共数据库中的AI生成内容越多，AI就越是在自我训练中引用这些语料库。这现在似乎不是问题，但在10到15年后，当数十亿个AI生成的产物被扩散并贡献到互联网或人类相关数据库这一通用参考语料库时，我们验证这些引用是否确实基于现实的能力会发生什么？如果人类或相关工具被构建出来，在技术栈中引入归因和可审计性，那么这不一定是问题。否则，我认为我们将面临更严重的风险。我们将无法有效判断某个信息资源是AI生成的还是人类生成的，更不用说其真实性和现实依据了。因此，我们无法辨别符号产物之间的统计关系是否基于真实的基准。这现在不是问题。但在未来AI管理交通、武器系统、电网和通信设备的状态下，会带来严重后果。即使无法归因的AI生成不直接影响这些系统，它也会影响构建、维护和改进这些系统的生产系统（公司）所做的决策。这只是威胁向量之一。故意将不真实且无法验证的引用引入语料库会导致更大的问题，即无法判断某个信息资源是否由人类生成，以及人类引入该信息资源到信息资源池时的意图（如果有的话）。从动态角度来看，我担心的具体比率是：内容生成速度 / 内容验证速度，乘以或加上内容生成难度 / 内容验证难度。

查看原文

真实性问题

相似文章

人们现在对AI的感受如何。

如果网上关于AI的炒作和恐惧大部分其实是由AI自己生成的，那会有多酷/令人担忧？

AI垃圾内容正在成为一场溯源危机，而不仅仅是内容质量的问题

非主流观点：随着AI越来越好，人们不会“回归真实”

人们对AI生成内容/工作的透明度需要达到什么程度？

提交意见反馈