Notion 基于 GPT-5 的重建解锁自主 AI 工作流

OpenAI Blog 产品

摘要

Notion 使用 GPT-5 重建了 AI 系统架构,启用了能够在平台上推理、规划和执行完整工作流的自主 AI 代理。新的 Notion 3.0 在用户对齐任务上比最先进的模型提高了 7.6%,在多步骤结构化任务上提高了 100% 以上。

Notion 使用 GPT-5 重建了 AI 架构,创建了能够在工作流中推理、执行和自适应的代理,在 Notion 3.0 中解锁了更快更灵活的生产力。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/04/20 14:52

# Notion 利用 GPT-5 重建系统,开启自主 AI 工作流 来源:https://openai.com/index/notion/ OpenAI,2025年11月7日 Notion 通过使用 GPT-5 重建其智能体系统,创造了一个能够进行推理、执行操作和跨工作流自适应的 AI 工作空间。 公司规模:中端市场 地区:北美 行业:技术 产品:API ## 成果 **7.6%** 相比最先进模型在与真实用户反馈一致的输出上的改进 在 2022 年末,Notion 获得 GPT-4 访问权限的几周内,就已经推出了写作助手、部署了工作区范围的问答功能,并在其搜索、内容和规划工具中深度集成了 OpenAI 模型。 但随着模型的进步——用户开始要求智能体完成整个工作流——Notion 的团队看到了他们系统架构的局限。让模型执行孤立任务的老模式限制了平台的能力上限。智能体需要做出决策、协调工具、并通过歧义进行推理,这种转变需要的不仅仅是提示工程。 > "我们不想对系统进行改造。我们需要一个真正支持推理模型工作方式的架构。" Notion 的 AI 建模主管 Sarah Sachs ## 为推理模型重建,而非改造 Notion 没有修补现有堆栈,而是重建了它。他们用一个协调模块化子智能体的中央推理模型替换了特定任务的提示链。这些智能体可以搜索 Notion、Slack 或网络;添加或编辑数据库;并使用任务所需的工具合成响应。 通过推出 Notion 3.0,AI 不仅嵌入在工作流中;它现在可以运行工作流。用户分配一个宽泛的任务——例如汇总利益相关者反馈——他们的智能体会规划、执行并报告结果。向选择如何工作的智能体转变意味着从一开始就为模型自主性进行设计。 ## 使用真实产品工作负载测试 GPT-5 为了验证架构转变,Notion 使用实际用户任务评估了 GPT-5 与其他最先进模型的对比。 评估基于 Notion 已标记为高优先级的反馈,包括研究模式中出现的问题、需要多步骤推理的长格式任务,以及模型判断至关重要的模糊或过时内容。 团队使用了 LLM 作评判评分、结构化测试固件和人工标注反馈的组合。 关键结果: - 在与真实用户反馈一致的输出上相比最先进模型提升 7.6% - 在困难的研究模式问题上性能提升 15% - 在截止日期更新和竞争对手研究等多步骤结构化任务上提升超过 100% - 唯一在冲突或过时输入情况下完全饱和基准的模型 这些评估帮助 Notion 确定了 GPT-5 增加价值的地方——例如推理、歧义处理、研究——以及环境特定调整可以改进的地方。 > "我们没有精选任务。这些都是来自我们产品的高信号工作流……这是模型差异真正出现的地方。" ——Notion 的 AI 建模主管 Sarah Sachs 一组九人坐在明亮的办公室会议室的会议桌周围,有人拿着笔记本电脑做出和平手势。右边的大屏幕显示三名远程参与者的视频通话。每个人看起来都放松且快乐,表明这是一个协作的混合团队会议。 ## 为使用 GPT-5 的团队提供的经验 Notion 的重建不仅仅是关于推出 Notion 3.0。而是设计一个可以支持新模型能力并随着这些模型变得更聪明而适应的系统。他们的方法为其他在生产中部署智能体 AI 的团队提供了清晰的路线图: - 评估重要的内容。使用用户实际执行的任务,而不是合成基准。 - 测试困难的东西。GPT-5 在信息模糊、过时或多步骤时表现出色。 - 为自主性进行架构设计。如果智能体要做决策,你的系统必须给它推理的空间和行动的工具。 - 清晰度提高性能。即使是顶级模型在没有清晰的工具描述和良好界面设计的情况下也会不足。 - 重建优于修补。如果你的系统是为完成模型构建的,它可能无法扩展到智能体。 > "我们已经从重建中看到回报……如果下一个模型解锁新功能,我们会竭尽所能支持它。" ——Notion 的 AI 建模主管 Sarah Sachs ## 继续阅读

相似文章

介绍 GPT-5

OpenAI Blog

OpenAI 推出 GPT-5,这是 AI 智能的重大飞跃,在代码编写、数学、写作、健康和视觉感知等方面展现了最先进的性能。这个统一系统包括一个高效的智能模型、一个深度推理模型(GPT-5 thinking)和一个实时路由器,用于最优响应选择。

推出 GPT-5.2

OpenAI Blog

OpenAI 推出 GPT-5.2,这是目前最强大的模型系列,在知识工作、代码生成、图像理解、长上下文理解和工具调用方面都有显著提升。GPT-5.2 Thinking 变体在专业基准测试中达到最先进的性能,在 44 个职业的 GDPval 任务中,70.9% 的表现超越了人类专家。

GPT-5 和工作的新时代

OpenAI Blog

OpenAI 宣布推出 GPT-5,这是他们最先进的模型,统一了 GPT-4o、o 系列推理、智能体和高级数学等功能,将立即向 Team 用户推出,并为开发者提供 API 访问。此次发布是一个重大里程碑,已有 7 亿周活跃 ChatGPT 用户和 500 万付费企业用户在使用 OpenAI 的技术。

面向开发者推出GPT-5.1

OpenAI Blog

OpenAI发布了GPT-5.1,这是GPT-5系列中的一个新模型,它可以基于任务复杂度动态调整思考时间,在保持前沿智能的同时,性能比GPT-5快2-3倍。此次发布包括扩展的提示缓存(24小时保留)、新的编码工具(apply_patch和shell),以及针对延迟敏感应用的“无推理”模式。

GPT-5.5 正式发布

OpenAI Blog

OpenAI 发布了 GPT-5.5,这是其前沿 AI 模型的重大升级,在保持高效与速度的同时,在智能体编码、研究以及多步骤任务执行等方面具备更强的能力。