推动内容溯源,构建更安全、更透明的人工智能生态系统
摘要
OpenAI宣布新的内容溯源举措,包括符合C2PA标准、集成Google DeepMind的SynthID图像水印技术,以及预览一款验证工具,帮助用户识别AI生成的内容。
OpenAI通过内容凭证(Content Credentials)、SynthID和一款验证工具推进AI内容溯源,帮助人们识别并信任AI生成的媒体。
查看缓存全文
缓存时间: 2026/05/19 19:14
# 推进内容溯源,构建更安全、更透明的人工智能生态系统
来源:https://openai.com/index/advancing-content-provenance/
人们每天都在使用 OpenAI 的工具创建和编辑图像与音频,这让沟通更具表现力、更有用、也更易访问。随着这些工具成为人们构建、想象和分享的一部分,理解并验证媒体的来源变得至关重要,这样人们才能更自信地解读内容。溯源性信号可以通过提供关于内容来源、创建或编辑方式以及其真实性等背景信息来提供帮助。
今天,我们通过一种多层、生态驱动的模式来强化内容溯源策略,以建立网络信任。我们通过遵守 C2PA 标准,让我们的溯源性信号更易于被其他工具和平台识别;通过与 Google 合作,为图像添加持久的跨平台 SynthID 水印;并公开预览一款可供公众验证图像是否来自 OpenAI 的工具。
这些更新共同建立在我们的早期工作(https://openai.com/index/understanding-the-source-of-what-we-see-and-hear-online/?utm_source=chatgpt.com)之上,以支持开放标准,使 OpenAI 生成的内容更容易被识别,并与行业合作,共同支持一个更可信的信息生态系统。
## 通过 C2PA 符合性构建信任生态系统
自 2024 年起,OpenAI 便参与并推动了溯源标准的制定与采用。当时,我们开始为 DALL·E 3(opens in a new window)(https://cdn.openai.com/papers/DALL_E_3_System_Card.pdf)生成的图像添加内容凭证,后来又将其应用于 ImageGen(opens in a new window)(https://cdn.openai.com/11998be9-5319-4302-bfbf-1167e093f1fb/Native_Image_Generation_System_Card.pdf)和 Sora(opens in a new window)(https://deploymentsafety.openai.com/sora-2/provenance-and-transparency-initiatives)。我们还加入了内容溯源与真实性联盟(C2PA)的指导委员会,该联盟是负责内容溯源开放技术标准的跨行业组织。C2PA 的技术方法利用元数据和加密签名,帮助关于媒体的信息安全地随内容本身一起传输。这些信息包括为记者评估来源、平台做出完整性决策以及人们尝试理解所看到内容提供的背景。
我们最近迈出了一步,使 OpenAI 成为 C2PA 符合性生成器产品(opens in a new window)(https://c2pa.org/conformance/)。通过符合 C2PA 标准,我们为平台提供了一种可信的方式来读取、保留和传递我们附加到内容上的溯源信息。这一点至关重要,因为溯源只有在内容创建的第一个平台之外仍能存在才有效,而符合性使得这一点成为可能。
## 通过 Google SynthID 实现图像的多层溯源方法
C2PA 元数据是溯源的重要基础。它帮助内容携带有关来源、创建或编辑方式以及签名者等信息。但元数据并非万无一失。它可能被剥离、在上传和下载过程中丢失,或因文件格式更改、调整大小或截图等转换而损坏。
为了使溯源更具韧性,我们采用了多层方法,并开始通过 Google DeepMind 的 SynthID(opens in a new window)(https://deepmind.google/models/synthid/)嵌入水印,首先应用于通过 ChatGPT(https://openai.com/index/introducing-chatgpt-images-2-0/)、Codex 或 OpenAI API 生成的图像。SynthID 嵌入了一个不可见的水印层,与基于 C2PA 元数据的方法互为补充。
我们为此已筹备了一段时间。我们在 Sora 中使用了可见水印(https://openai.com/index/launching-sora-responsibly/),在 Voice Engine 中使用了音频水印(https://openai.com/index/expanding-on-how-voice-engine-works-and-our-safety-research/),并在部署过程中持续测试与研究其准确性和可靠性。
这两个系统相互增强。C2PA 帮助内容携带详细背景;SynthID 则能在元数据无法保留时保存信号。水印在面对截图等变换时通常更持久,而元数据能提供比单独水印更丰富的信息。两者结合,使溯源比任何单一层都更具韧性。
可信的元数据和能抵抗大多数修改的水印可使溯源性信号更持久。但人们需要一种检测这些信号的方法。我们现在预览一款公共验证工具(https://openai.com/verify),它将帮助人们验证上传的图像是否来自 ChatGPT、OpenAI API 或 Codex,通过检查是否包含内容凭证和 SynthID 等溯源性信号。
我们认为,溯源应该让人们更容易验证和理解,而我们工具通过整合多种信号,帮助人们解答“这是用 AI 生成的吗?”这一问题。这建立在 2024 年我们图像检测分类器(https://openai.com/index/understanding-the-source-of-what-we-see-and-hear-online/)初步研究预览的基础上,使人们能够可靠地检测媒体中是否存在源自 OpenAI 的 SynthID 水印,并在发现时展现 C2PA 元数据。
OpenAI 网页显示上传图像的验证结果,确认该图像基于检测到的 SynthID 和内容凭证信号,由 OpenAI 工具生成。
没有哪种检测方法是万无一失的,因此我们在检测失败时采取谨慎态度。例如,如果未检测到元数据或水印,该工具不会对图像是否由 OpenAI 工具生成做出确定性结论,因为溯源性信号在某些情况下可能被移除。
该工具在发布时仅限于 OpenAI 生成的内容。未来几个月,我们计划支持跨行业努力,使跨平台验证成为可能。随着时间的推移,我们还希望支持人们在线可能遇到的更多类型内容。
## 展望未来
没有单一溯源技术能够独立胜任。我们认为,强有力的方法需要结合共享标准、持久的水印信号和公开验证。通过在我们长期支持内容凭证的基础上,成为 C2PA 符合性产品、采用 SynthID 并预览公共验证工具,我们希望长期为更可互操作的溯源生态系统做出贡献。
相似文章
@OpenAI:我们正在增加新方法,帮助人们识别AI生成的图像并了解其来源。除了C2…
OpenAI宣布新的内容溯源功能,包括C2PA内容凭证、来自Google DeepMind的SynthID水印,以及一个公开验证工具,用于识别来自其产品的AI生成图像,旨在提高透明度和信任度。
理解我们在线看到和听到的内容来源
OpenAI宣布推出工具和研究成果,帮助验证内容真实性,包括文本水印、元数据方法和扩展的图像检测,以及与C2PA元数据集成,用于追踪AI生成和编辑的内容。
OpenAI 让检查图片是否由自家模型生成变得更简单
OpenAI 宣布了包括 C2PA 元数据和 SynthID 水印在内的新措施,以帮助验证由其模型生成的图片,同时还推出了一款公开验证工具。
Provenance: 在人工智能主导的信息环境中的生存工具包
本文讨论了信息环境中日益严重的人工智能生成欺骗的威胁,并提出 provenance(内容认证的生态系统级采纳)作为补救措施,重点强调了如 AI 诈骗、捏造科学数据和协调虚假信息活动等风险。
让理解内容的创建和编辑方式变得更简单
谷歌正在搜索、Gemini、Chrome、Pixel和云端中扩展内容透明度和验证工具,使用SynthID和C2PA内容凭证帮助用户识别AI生成或修改的内容。