标签
OpenAI 和 Sam Altman 面临一项因 ChatGPT 提供危险医疗建议导致用户过量用药致死而提起的错判死亡诉讼。此案凸显了关于人工智能对现实世界危害和安全故障责任的持续法律挑战。
本文重点介绍了“交互模型”,它能够在对话过程中对语音进行实时事实核查,充当一位专注的队友。
《纽约时报》发布更正声明,指出此前发现一款 AI 工具生成了加拿大政治家 Pierre Poilievre 的虚假引言,突显了新闻报道依赖 AI 所带来的风险。
# 当虚假信息发声与对话:重塑音频平台的事实核查机制 来源:[https://arxiv.org/abs/2604.16767](https://arxiv.org/abs/2604.16767) [查看PDF](https://arxiv.org/pdf/2604.16767) > 摘要:音频平台已超越娱乐范畴。它们已成为公众话语的核心,从播客、广播到WhatsApp语音留言和直播无处不在。凭借数百万档节目与数亿听众,音频平台如今已成为虚假信
本文研究了为大语言模型赋予角色是否会引发类似人类的动机推理,发现赋予角色的大语言模型真实性辨别能力最多下降9%,并且以与其诱导的政治身份一致的方式评估科学证据的可能性最多增加90%,而基于提示的去偏见方法基本无效。
# 批判性审视AI语言模型(所谓的"胡说八道机器") 这是一篇PDF论文,批判性地审视AI语言模型(即所谓的"胡说八道机器"),主要论述这类模型倾向于产生虚假或误导性输出的问题。该文章似乎是一篇关于AI生成虚假信息本质的论战性或哲学性文章。 --- ## 核心论点概述 ### 1. "胡说八道"的哲学定义 该论文很可能援引哲学家**Harry Frankfurt**在其著作《论胡说八道》(*On Bullshit*)中提出的概念框架。Frankfurt将"胡说八道"与"谎言"区分开来: - **说谎者**知道真相,但故意隐瞒 - **胡说八道者**对真相漠不关心——他们的目标不是传达真实信息,而是产生某种**印象**或**效果** 这一区分对AI语言模型而言尤为关键。 --- ### 2. 为何AI语言模型是"胡说八道机器" 论文可能提出以下核心论据: #### **结构性原因** - 大型语言模型(LLMs)的训练目标是**预测下一个词**,而非**传达真实信息** - 模型没有"相信某事为真"的内在动机,只有"生成听起来合理的文本"的优化目标 - 这与Frankfurt的定义高度吻合:**对真相的漠视**是其核心特征 #### **技术层面的体现** - **幻觉(Hallucination)**:模型会自信地生成根本不存在的事实、引用、人名 - **确信感与准确性脱钩**:模型的语气自信程度与内容准确性之间几乎没有相关性 - **语境迎合**:模型倾向于生成用户"想听到"的内容,而非客观准确的内容 --- ### 3. 社会与认识论层面的危害 论文可能进一步论述这一问题的深远影响: | 危害类型 | 具体表现 | |---------|---------| | **认识论污染** | 大规模传播似是而非的错误信息 | | **权威性幻觉** | 流畅、自信的语言风格赋予错误信息以可信度 | | **批判性思维侵蚀** | 用户对AI输出缺乏质疑习惯 | | **规模效应** | 单一模型可同时向数百万用户传播错误内容 | --- ### 4. 与传统媒体虚假信息的比较 > *"传统的谎言需要意图;AI的胡说八道不需要。"* 论文可能指出,AI生成的虚假信息在某种意义上比传统谎言**更危险**: - 没有可追责的"说谎者" - 错误以**中立、客观的语调**呈现 - 生产成本极低,可无限扩展 --- ### 5. 批判的哲学深度 该论文可能触及以下哲学议题: - **真理符合论 vs. 语用主义**:语言模型的"真理观" - **意向性问题**:没有意图的系统能否被称为"欺骗者"? - **后真相时代**:AI是否加速了我们对客观真相的放弃? --- ## 可能的反驳与局限性 一篇严肃的论文也可能考虑反方观点: 1. **工具论立场**:AI只是工具,责任在使用者 2. **改进论**:通过RLHF、事实核查等技术可以缓解幻觉问题 3. **比较论**:人类专家同样会犯错、会说谎,AI并非独一无二的问题 --- ## 结语 这类论文的核心价值在于:它**拒绝将AI幻觉问题简单归结为技术bug**,而是将其定性为一个**结构性的、哲学层面的问题**——语言模型从根本上就不是被设计来"说真话"的,而是被设计来"说听起来像真话的话"。 这一区别,或许是我们理解和规范AI系统时最需要认真对待的洞见之一。 --- *如需获取原始PDF或进一步分析具体章节内容,请提供更多文本摘录。*
本文指出科学文献中一个反复出现的拼写错误:化合物Cr2Ge2Te6(铬锗碲)被误写为Cr2Gr2Te6,并讨论了这类错误如何传播以及可能被人工智能系统放大。
Google宣布推出SynthID Detector验证平台,该平台可以通过检测Google AI工具生成的媒体中嵌入的肉眼看不见的SynthID水印,来识别跨越图像、音频、视频和文本的AI生成内容。该平台正向早期测试者推出,计划面向记者、媒体专业人士和研究人员提供更广泛的访问权限。
OpenAI 发布了 2024 年选举防护措施,包括将用户引导至权威投票信息来源、防止生成政治人物的深度伪造内容,以及破坏隐蔽影响力操纵活动。该公司报告称已将约 100 万个 ChatGPT 回复重定向到投票资源,并拒绝了超过 25 万个生成政治人物图像的请求。
OpenAI宣布与美国新闻项目建立合作伙伴关系,承诺提供500万美元的资金加上最多500万美元的API额度,帮助本地新闻机构探索和部署AI技术。这一合作旨在开发增强新闻业的工具,同时应对虚假信息、偏见和版权问题等挑战。