Patronus AI获得5000万美元融资,用于构建对AI智能体进行压力测试的“数字世界”

TechCrunch AI 新闻

摘要

Patronus AI完成5000万美元B轮融资,用于构建模拟数字世界以对AI智能体进行压力测试,帮助确保它们在现实场景中可靠运行。

投资方表示,由前Meta AI研究员创立的智能体测试初创公司Patronus AI,正面临着几乎无法满足的需求。
查看原文
查看缓存全文

缓存时间: 2026/06/25 23:14

# Patronus AI 获 5000 万美元融资,构建压力测试 AI 代理的“数字世界” | TechCrunch 来源:https://techcrunch.com/2026/06/25/patronus-ai-lands-50m-to-build-digital-worlds-that-stress-test-ai-agents/ AI 代理正变得越来越复杂。它们正从回答问题演变为自主执行多步骤的复杂任务。 但在这些代理能够被信任去为用户预订行程或进行财务分析之前,模型提供方以及构建这些代理的初创公司希望确保它们能在广泛场景下可靠运行。 AI 实验室常使用基准测试来展示模型的能力,但高分(即使是面向代理的基准测试)并不能真正证明 AI 能够正确完成各种复杂的现实工作任务。 Patronus AI (https://www.patronus.ai/) 是一家由前 Meta AI 研究员 Anand Kannappan 和 Rebecca Qian 于 2023 年创立的初创公司。它通过构建模拟数字环境来评估代理的性能,帮助模型制造商和公司对模型进行微调,以实现这一目标。 这家总部位于旧金山的初创公司想必正在解决一个重要问题。据 Notable Capital 董事总经理 Glenn Solomon 称,几乎所有前沿 AI 实验室和许多新兴初创公司都已成为其客户,他形容市场对公司模拟环境的需求几乎是“无法满足的”。 Patronus 的收入在过去一年增长了 15 倍,引发了投资者的极大兴趣。周四,该公司宣布获得 5000 万美元的 B 轮融资,由 Greenfield Partners 领投,Notable Capital、Lightspeed、Datadog 和 Samsung 参投。该轮融资使公司总融资额达到 7000 万美元。 Patronus 使用其所谓的“数字世界模型”来创建网站和内部系统的副本。在这些环境中,代理在使用强化学习进行训练后会接受压力测试,强化学习会迭代地奖励成功完成任务的行为并惩罚错误。 AI 实验室非常看重这些数字模拟,因为它们让代理有机会尝试不同的、有时是无法预测的场景。该公司将其方法比作 Waymo 训练自动驾驶汽车的方式:首先构建虚拟世界,然后针对罕见危险(如恶劣天气或孩子追逐球跑出来)测试车辆。 与 AI 代理的不同之处在于,它们倾向于走捷径,这意味着它们无法正确完成任务。“Patronus 非常擅长发现这些投机取巧的行为,并确保模型对此负责,”Solomon 说。 Patronus 目前为软件工程和金融领域提供其模拟数字世界,但据 Kannappan 称,这仅仅是开始。 “如今我们非常专注于可验证的问题,也就是那些可以立即检查并验证的问题,但还有大量领域是非常难以验证或很难验证的,”他说。 仅仅因为这些过程是可验证的,并不意味着它们简单。“我们希望真正能够创建这样一个环境,在其中我们可以运行一个代理,让它持续运行 10 小时、10 天甚至 10 周,”Kannappan 说。 至于竞争对手,Patronus 认为其主要与 AI 实验室内部已经建立的用于评估代理行为的团队竞争。虽然像 Mercor 和 Surge 这样的人力数据公司帮助模型制造商进行强化学习,但 Patronus 的运作方式不同,它无需任何人参与就能评估代理的行为。 *当您通过我们文章中的链接购买商品时,我们可能会获得少量佣金 (https://techcrunch.com/techcrunch-affiliate-monetization-standards/)。这不会影响我们的编辑独立性。* Marina Temkin 是 TechCrunch 的风险投资和初创公司记者。在加入 TechCrunch 之前,她为 PitchBook 和《风险投资杂志》撰写风险投资相关内容。在她的职业生涯早期,Marina 曾担任金融分析师,并获得 CFA 持证人资格。 您可以通过电子邮件 [[email protected]](mailto:[email protected]) 或通过 Signal 加密消息(+1 347-683-3909)联系或核实来自 Marina 的来访。 查看简介 (https://techcrunch.com/author/marina-temkin/)

相似文章

为所有人扩展AI

OpenAI Blog

OpenAI宣布获得1100亿美元新融资,融资前估值为7300亿美元,融资方包括SoftBank、NVIDIA和Amazon等主要投资者,并建立战略合作伙伴关系以扩展计算能力和AI产品的全球覆盖范围。该融资旨在加速前沿AI在消费者、开发者和企业中的部署。

投资多智能体AI安全研究

Google DeepMind Blog

Google DeepMind 与 Schmidt Sciences、Cooperative AI Foundation、ARIA 和 Google.org 共同宣布,为多智能体AI安全研究提供高达1000万美元的资金,用于研究交互AI智能体的涌现行为与风险。