深度研究系统卡
摘要
OpenAI 推出 Deep Research,这是一个由早期版本 o3 驱动的智能体功能,能够为复杂任务执行多步网络研究。在向 Pro 用户推出前,已实施全面的安全测试和隐私保护。
本报告概述了在发布深度研究前开展的安全工作,包括外部红队测试、根据我们《准备框架》进行的前沿风险评估,以及我们为应对关键风险领域而构建的缓解措施概览。
查看缓存全文
缓存时间: 2026/04/20 14:48
# Deep Research 系统卡
来源:https://openai.com/index/deep-research-system-card/
Deep research 是一项新的代理能力,可以针对复杂任务进行多步骤的互联网研究。Deep research 模型由针对网页浏览进行优化的 OpenAI o3 早期版本驱动。Deep research 利用推理能力来搜索、解释和分析互联网上海量的文本、图像和 PDF 文件,并根据遇到的信息灵活调整研究方向。它还可以读取用户提供的文件,并通过编写和执行 Python 代码来分析数据。我们相信 deep research 将在广泛的应用场景中为用户带来帮助。
在向 Pro 用户推出 deep research 之前,我们进行了严格的安全测试、准备情况评估和治理审查。我们还进行了额外的安全测试,以更好地了解与 deep research 网页浏览能力相关的增量风险,并采取了新的缓解措施。新工作的关键领域包括加强对在线发布的个人信息的隐私保护,以及训练模型以抵抗在互联网搜索过程中可能遇到的恶意指令。
与此同时,我们对 deep research 的测试也为进一步改进我们的测试方法提供了机会。在扩大 deep research 发布范围之前,我们花时间对选定风险进行了进一步的人工探测和自动化测试。
基于 OpenAI 既定的安全实践和准备框架,本系统卡提供了关于我们如何构建 deep research、了解其能力和风险,以及在推出前改进安全性的更多详情。
相似文章
推出深度研究
OpenAI 推出深度研究功能,这是 ChatGPT 中由 o3 驱动的代理能力,能够自主进行多步骤互联网研究以生成专业级分析报告,从 2026 年 2 月起扩展访问权限和功能。
OpenAI o3 和 o4-mini 系统卡
OpenAI 发布了 o3 和 o4-mini 模型的系统卡,这些模型具有先进的推理能力,结合了工具集成(网络浏览、Python、图像分析等),并根据 OpenAI 的 Preparedness Framework v2 在生物、网络安全和 AI 自我改进等领域进行了安全性评估。
OpenAI o3-mini 系统卡
OpenAI 发布了 o3-mini 系统卡,记录了其通过强化学习训练的高级推理模型的安全评估和风险评估。该模型在某些基准测试中达到了最先进的安全性能,在 OpenAI 的《准备框架》下总体被列为中等风险。
OpenAI o1 系统卡
OpenAI 发布了 o1 系统卡,详细介绍了 o1 和 o1-mini 模型的安全评估和准备框架评估。这些模型采用思路链推理,并通过大规模强化学习进行训练,以提高安全性和稳健性。
推出 Deep Research 与 Deep Research Max
Google DeepMind 发布由 Gemini 3.1 Pro 驱动的自主研究智能体 Deep Research 与 Deep Research Max,支持 MCP,面向企业工作流。