破坏隐蔽影响力行动对AI的欺骗性使用

OpenAI Blog 新闻

摘要

OpenAI 报告破坏了五个试图滥用其 AI 模型进行欺骗性宣传的隐蔽影响力行动,研究结果表明安全设计的模型阻止了威胁行为者生成所需内容。该公司正在发布趋势分析,并与行业、民间社会和政府合作打击 AI 驱动的信息操纵。

我们已终止与隐蔽影响力行动相关的账户;由于我们的服务,没有显著的受众增长。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:47

# 破坏秘密影响力行动对AI的欺骗性使用 来源:https://openai.com/index/disrupting-deceptive-uses-of-ai-by-covert-influence-operations/ OpenAI 致力于执行防止滥用的政策,并提高 AI 生成内容的透明度。这对于检测和破坏秘密影响力行动(IO)尤为重要,这些行动试图在不披露幕后行为者真实身份或意图的情况下操纵舆论或影响政治结果。 在过去三个月里,我们已经破坏了五个秘密影响力行动,这些行动试图利用我们的模型支持互联网上的欺骗性活动。截至 2024 年 5 月,这些活动似乎并未因使用我们的服务而显著增加其受众参与度或覆盖范围。 本博文介绍了我们破坏的威胁行为者、我们发现的攻击者趋势以及重要的防御趋势——包括如何通过在设计 AI 模型时考虑安全因素,在许多情况下防止威胁行为者生成所需的内容,以及 AI 工具如何使我们自己的调查更加高效。除了本博文外,我们还发布了一份趋势分析报告,详细描述了这些恶意行为者的行为。 阅读完整报告(在新窗口中打开)(https://cdn.openai.com/threat-intelligence-reports/threat-intel-report-may-2024.pdf) 威胁行为者活跃于互联网各处。我们也是如此。通过与业界、民间社会和政府的合作,我们致力于应对 IO 内容的创建、传播和影响。我们的调查和破坏工作得以进行,部分原因在于多年来分发平台和开源社区提供了大量详细的威胁报告。OpenAI 正在发布这些发现,就像其他科技公司一样,以促进更广泛的利益相关者社区之间的信息共享和最佳实践。

相似文章

关于破坏欺骗性AI使用的最新进展

OpenAI Blog

OpenAI 发布了一份威胁情报报告,详细说明了在全球范围内破坏20多起欺骗性AI行动的工作,重点关注与国家相关的行为者和影响力运动,考虑到全球选举,这些问题特别令人担忧。

打击AI恶意使用

OpenAI Blog

OpenAI 发布了一份年度报告,详细介绍了其在阻止与国家相关的行为体和其他恶意行为体滥用AI工具的努力,包括防止这些工具被用于专制控制、儿童剥削、信息操纵和网络攻击等目的。

破坏AI的恶意使用:2025年10月

OpenAI Blog

OpenAI发布了2025年10月关于破坏AI恶意使用的报告,详细介绍了自2024年2月以来破坏的40多个违反使用政策的网络,包括国家关联威胁、诈骗和影响力操作。

遏制人工智能的恶意使用 | 2026年2月

OpenAI Blog

OpenAI 发布了2026年2月的威胁报告,详细介绍了检测和防止人工智能恶意使用的案例研究,重点说明了威胁行为者如何将AI模型与传统工具结合,并在协调行动中滥用多个平台和模型。

打击国家支持的威胁行为者滥用AI

OpenAI Blog

OpenAI和Microsoft破获了五个来自中国、伊朗、朝鲜和俄罗斯的国家支持的威胁行为者,他们滥用AI服务进行钓鱼攻击、代码分析和信息收集。这些行为者已被识别并账户已被停用,研究结果显示GPT-4在恶意网络安全任务中相比现有工具的增量能力有限。