利用 OpenAI 扩展会计产能
摘要
AI 初创公司 Basis 成立于 2023 年,利用 OpenAI 模型(o3、o3-Pro、GPT-4.1 和 GPT-5)扩展会计自动化,构建多智能体系统,帮助会计师事务所自动化对账、日记账分录和财务汇总,可节省高达 30% 的时间。该公司的多智能体架构根据复杂程度将任务分配给专门的智能体,GPT-5 作为监督智能体,因其卓越的推理和可解释性能力而被选中。
Basis 采用 OpenAI o3、o3-Pro、GPT-4.1 和 GPT-5 构建的 AI 智能体帮助会计师事务所节省高达 30% 的时间,并扩展顾问和增长业务的容量。
查看缓存全文
缓存时间:
2026/04/20 14:48
# Basis 通过将 OpenAI 模型进展转化为可信代理来扩展会计工作
来源: https://openai.com/index/basis/
有些初创公司用 AI 解决特定时间点的问题。而另一些则构建随着 AI 进步而不断优化的系统。[Basis](https://www.getbasis.ai/) 属于后者。
Basis 成立于 2023 年,为顶级会计事务所打造 AI 代理——专门设计用于处理结构化会计工作,具备这些任务所需的可靠性和深度。该团队使用 OpenAI o3、o3-Pro、GPT-4.1 和 GPT-5 来驱动 AI 代理,帮助会计事务所自动化对账、日记账分录和财务汇总等重复性任务,同时让会计师能够完全了解决策的制定方式并控制整个流程。最终可节省高达 30% 的时间,并增加处理高价值工作的容量,如客户咨询和拓展新业务。
随着 OpenAI 模型的演进,Basis 的能力也在不断提升。每次新版本发布都会扩展代理能处理的工作范围,提升推理质量,加快审查速度,并解锁更复杂的工作流。
Basis 联合创始人 Mitchell Troyanovsky 表示:"我们从第一天起就与 OpenAI 合作。每次模型改进都能拓展我们代理的功能范围。随着推理能力的提升,我们能解锁更复杂、运行时间更长的工作流,并赋予代理更大的自主权。"
Basis 将会计工作视为一个工作流系统,每个工作流都有自己的上下文和复杂度。为了支持这一点,该团队构建了多代理架构,将最合适的 OpenAI 模型分配给相应的任务。
每个任务都以监管代理开始,该代理最初建立在 OpenAI o3 基础上,现已迁移到 GPT-5,用于协调整个流程——根据任务、复杂度、延迟需求和输入类型,将步骤路由到专门的子代理。GPT-5 是 Basis 迄今为止在推理、一致性和可解释性方面评估过的最强大模型,非常适合在高上下文工作流中引导代理,所需监督最少。
子代理由多种模型驱动,这些模型通过内部基准套件选择,该套件根据关键能力和特性对每个模型进行评分。对于速度关键的交互,如审查中途澄清问题或快速反馈,Basis 依赖 GPT-4.1。
在更复杂的场景中,如解释异常交易模式、解决模糊分类或管理月末结账等多步骤流程,Basis 代理再次依靠 GPT-5 的深度推理能力。
这种编排方式使 Basis 能够随着模型能力的增长而不断改进任务覆盖范围和准确性。
在会计领域,自动化只有在可审查的情况下才最有用。Basis 代理独立运行,但通过中央层共享上下文,呈现假设、数据来源和每项决策背后的逻辑。Basis 最初依靠 OpenAI o3-Pro 在工作流中扩展推理,后来在 GPT-5 发布后迁移至 GPT-5,因为它能够推理结构化流程并解释如何得出结果。
以日记账分录为例。监管代理审查支持材料、检索数据、参考共享上下文和最佳实践,并协调子代理准备其工作。会计师看到分录以及使用了哪些数据、为什么以这种方式映射以及系统对其建议的信心程度的清晰说明。
Troyanovsky 指出:"我们所做的一切都取决于推理。这就是为什么 OpenAI 的模型,特别是 GPT-5,至关重要。通过将测试时间计算扩展到远超早期模型所支持的水平,同时仍然展示模型的推理过程,我们能够提供解释,让客户了解并控制正在发生的事情。"
这种推理能力还支持监管代理以上下文和精准度路由任务的能力。随着系统的成熟,Basis 从任务自动化发展到真正的工作流委派。函数调用推进了这一进程,使代理能够完成多步骤流程,如对账和日记账分录,而不仅仅是提议它们,其方式反映了会计师的实际思考和工作方式。
每次新模型发布时,Basis 团队都会针对真实的会计工作流运行详细基准测试,评估的不仅是准确性,还有模型清晰解释推理过程的能力。这帮助团队决定依赖哪些模型完成各种任务,以及何时代理可以安全地接手新工作流。GPT-5 是 Basis 技术栈中目前最强大的模型,由于其在并行工具调用和高级推理方面的表现,非常适合需要深度和精准性的工作流。
GPT-5 表现突出的一个领域是并行工具调用——这是一项关键能力,使 Basis 的代理能够在单个工作流中协调多个结构化操作。在 Basis 的工具调用基准测试中,该测试评估了模型在启用代码解释器和网络搜索的情况下并行使用多个工具的能力,GPT-5 实现了完美的 100% 成功率,同时在推理基准上也领先所有其他模型。
GPT-5 凭借与 OpenAI 团队的密切合作,提供了他们大规模所需的性能。在整个开发过程中,Basis 分享了真实案例和边界情况,并提供了反馈,帮助塑造生产环境中的模型行为。
Troyanovsky 表示:"OpenAI 的模型在性能和部署速度上始终处于领先地位。推理能力和易用性的结合使我们的架构成为可能。这样的进步使 OpenAI 成为宝贵的合作伙伴。我们不仅是对模型改进做出反应,还在帮助推动这些改进。"
如今,Basis 支持美国大多数大型会计事务所的重要份额。使用 Basis 的事务所平均报告节省 30% 的时间,并随着信任度提高而不断扩展代理的职责范围。更重要的是,他们正在收回服务客户、探索新实践领域和深化咨询关系的能力。
Troyanovsky 表示:"OpenAI 对这一转变至关重要。他们的模型不仅性能出众,还帮助塑造了我们的构建方式和构建内容。随着模型的演进,我们代理能够处理的范围也随之扩大,进而扩大了会计师能够做的事情。"
相似文章
OpenAI Blog
Rogo 是一个企业 AI 财务平台,利用 OpenAI 的模型(GPT-4o、o1、o1-mini)扩展其 AI 驱动的财务研究,为 5,000 多位投资银行和私募股权公司的银行家提供服务。该平台通过自动化财务分析任务实现了 27 倍的 ARR 增长,为分析师在会议准备、公司分析和市场研究上节省了每周 10 小时以上的时间。
OpenAI Blog
# 用智能体自动化90%的金融和法律工作 来源: [https://openai.com/index/hebbia/](https://openai.com/index/hebbia/) OpenAI
投资者、银行家、顾问和律师花费无数小时梳理市场和股权研究、虚拟数据室、合同和监管备案,以做出高风险决策。[Hebbia\(在新窗口打开\)](http://hebbia.com/)推出了Matrix,这是一个多智能体AI平台,旨在处理最复杂的金融工作
OpenAI Blog
OpenAI 发布了最新的推理模型 o3 和 o4-mini,可以自主访问和组合所有 ChatGPT 工具(网络搜索、代码执行、图像分析、图像生成)。o3 在编程、数学和科学基准测试中达到业界最先进水平,主要错误比 o1 少 20%,而 o4-mini 则提供成本和速度优化的高效推理能力。
OpenAI Blog
Unify 是一个基于 AI 基础设施构建的 GTM 平台,利用 OpenAI o3、GPT-4.1 和计算机使用代理(CUA)来自动化潜在客户研究和个性化外联,现在其 30% 的销售线索来自 AI 驱动的工作流。
OpenAI Blog
# 将AI投入工作:财务运营自动化与规模化 来源: [https://openai.com/business/put-ai-to-work-automate-and-scale-financial-operations/](https://openai.com/business/put-ai-to-work-automate-and-scale-financial-operations/) 录制时间:2024年9月30日 网络研讨会[公司](https://openai.com/news/company-announcements/) 财务运营自动化与规模化。