破坏隐蔽影响力行动对AI的欺骗性使用

OpenAI Blog 2024/05/30 10:00 新闻

摘要

OpenAI 报告破坏了五个试图滥用其 AI 模型进行欺骗性宣传的隐蔽影响力行动，研究结果表明安全设计的模型阻止了威胁行为者生成所需内容。该公司正在发布趋势分析，并与行业、民间社会和政府合作打击 AI 驱动的信息操纵。

我们已终止与隐蔽影响力行动相关的账户；由于我们的服务，没有显著的受众增长。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:47

# 破坏秘密影响力行动对AI的欺骗性使用来源：https://openai.com/index/disrupting-deceptive-uses-of-ai-by-covert-influence-operations/ OpenAI 致力于执行防止滥用的政策，并提高 AI 生成内容的透明度。这对于检测和破坏秘密影响力行动（IO）尤为重要，这些行动试图在不披露幕后行为者真实身份或意图的情况下操纵舆论或影响政治结果。在过去三个月里，我们已经破坏了五个秘密影响力行动，这些行动试图利用我们的模型支持互联网上的欺骗性活动。截至 2024 年 5 月，这些活动似乎并未因使用我们的服务而显著增加其受众参与度或覆盖范围。本博文介绍了我们破坏的威胁行为者、我们发现的攻击者趋势以及重要的防御趋势——包括如何通过在设计 AI 模型时考虑安全因素，在许多情况下防止威胁行为者生成所需的内容，以及 AI 工具如何使我们自己的调查更加高效。除了本博文外，我们还发布了一份趋势分析报告，详细描述了这些恶意行为者的行为。阅读完整报告（在新窗口中打开）(https://cdn.openai.com/threat-intelligence-reports/threat-intel-report-may-2024.pdf) 威胁行为者活跃于互联网各处。我们也是如此。通过与业界、民间社会和政府的合作，我们致力于应对 IO 内容的创建、传播和影响。我们的调查和破坏工作得以进行，部分原因在于多年来分发平台和开源社区提供了大量详细的威胁报告。OpenAI 正在发布这些发现，就像其他科技公司一样，以促进更广泛的利益相关者社区之间的信息共享和最佳实践。

破坏隐蔽影响力行动对AI的欺骗性使用

相似文章

关于破坏欺骗性AI使用的最新进展

打击AI恶意使用

破坏AI的恶意使用：2025年10月

遏制人工智能的恶意使用 | 2026年2月

打击国家支持的威胁行为者滥用AI

提交意见反馈