标签
介绍了SynCred-Bench,这是一个包含600张AI生成的虚假信息图像的基准测试,涵盖六种可信形式类别,表明现有检测器(包括MLLMs、开源AIGC检测器和商业API)表现不佳,人类标注者同样难以识别。
作者认为生成式AI是有害的,指出其使用了窃取的训练数据、在传播虚假信息中的作用,以及体现了剥削性资本主义,同时将其与传统机器学习区分开来。
Uber CEO Dara Khosrowshahi表示,AI正在创造“超能力员工”,导致招聘放缓,因为AI提高了生产力,反驳了AI缺乏投资回报率的说法。
WIRED的一位专业事实核查员分享说,AI并不可靠,估计大约三分之一的AI生成信息是错误的,并主张人类的监督仍然至关重要。
本文介绍了一个红队测试框架,用于衡量开源LLM能够表达的政治观点的“奥弗顿窗口”,并评估简单的越狱手段如何扩大该范围,发现30多个模型存在系统性的左倾偏见和漏洞。
本文讨论了信息环境中日益严重的人工智能生成欺骗的威胁,并提出 provenance(内容认证的生态系统级采纳)作为补救措施,重点强调了如 AI 诈骗、捏造科学数据和协调虚假信息活动等风险。
本文研究在仇恨言论与错误信息同时出现时,利用大型语言模型辅助专家撰写反言论,通过人工评估测试了知识驱动策略。结合事实核查员与非政府组织指南的混合策略被证明最为有效。
Forum AI 的一项研究发现,ChatGPT、Gemini、Claude 和 Grok 等主要聊天机器人未能提供准确且无偏见的选举信息,其中 90% 的回答包含错误或偏见。
BBC的一项调查揭示了AI聊天机器人是如何被操纵来传播错误信息的,而谷歌正在悄然更新其垃圾信息政策以应对这一问题。
一条推文批评《人物》杂志重新发布一则已被辟谣的新闻,该新闻称一个数据中心消耗大量水资源,导致佐治亚州居民水压过低。
一项调查显示,Anthropic的克劳德AI引用了与伊朗伊斯兰革命卫队有关联的伊朗国家媒体作为验证来源,且无法解释为何选择这些来源。
一本探讨AI时代真相的书被发现包含由AI生成的编造引文,凸显了依赖AI获取事实准确性的讽刺意味和潜在陷阱。
本文讨论了AI幻觉如何造成真实的安全风险,并强调了2025年的一项基准测试,该测试显示大多数AI模型会给出自信但错误的答案。文章解释了原因,并呼吁对AI输出进行人工验证。
Gwern的这篇文章剖析了2022年《纽约时报》一篇关于青少年电子烟的文章,揭示了其如何通过选择性陈述误导读者认为合法尼古丁电子烟会导致类似EVALI的肺损伤,而实际原因却是含有维生素E醋酸酯的非法THC电子烟。
一位用户警告称,X 上虚假 AI 生成图片与捏造新闻故事的组合正在激增,而社区备注审核未能跟上节奏,预计问题将进一步恶化。
前Meta新闻主管坎贝尔·布朗创办了Forum AI,旨在评估基础模型在地缘政治、心理健康等高风险话题上的准确性,通过专家主导的基准测试来提升AI的真实性。
本文讨论了一起争议事件,据称 Google 的 Gemini 模型承认伊斯兰教宣扬仇恨,该说法源自 Reddit 上分享的一张图片。
本文指出,像 OpenAI 和 Anthropic 这样的 AI 实验室正通过虚假信息破坏民主信任,与此同时,它们又将自己嵌入政府体系,以提供 AI 治理方案。