Probably 获得 900 万美元融资,构建更可靠的人工智能

TechCrunch AI 新闻

摘要

Probably 从 Andreessen Horowitz 获得 900 万美元种子轮融资,通过确定性验证器系统捕获 LLM 幻觉,构建更可靠的人工智能系统,使小型模型能够在本地硬件上运行。

Probably 旨在防止幻觉和事实错误传递给用户,并达到与确定性系统相当的准确性。
查看原文
查看缓存全文

缓存时间: 2026/06/16 14:33

# Probably 融资900万美元,构建更可靠的AI | TechCrunch 来源:https://techcrunch.com/2026/06/16/probably-raises-9m-to-build-a-more-reliable-kind-of-ai/ 随着LLM越来越强大,幻觉问题却顽固地难以根除。即使最聪明的模型也会出现错误,虽然有一些方法可以捕捉这些错误,但业界仍在摸索最佳方案。 刚刚从Andreessen Horowitz获得900万美元种子轮融资的** Probably**(https://www.probably.dev/ )正试图构建一种更严谨的错误捕捉方法。 正如创始人Peter Elias(上图所示)所说,公司的目标是防止幻觉和简单事实错误传播到用户端,并实现确定性系统中常见的99.99%准确率——这一水平在AI中要难得多。事实证明,要让LLM达到这一准确率,需要重新思考AI工程的许多基本假设。 Probably的首款产品是一款数据科学工具,旨在从复杂数据集中快速给出答案。每个结果都附带引用和生成路径的审计追踪,这在AI工具中已越来越常见。 但要防止错误混入这些摘要,需要一套精密的约束系统——Elias将其描述为“数据科学机甲套装”。LLM的初步答案会与一个确定性验证系统进行核对,任何与数据集不符的结果都会被驳回。该公司表示,关键在于LLM已经过验证器的训练,并且整个系统针对快速准确的答案进行了优化。 “我们在构建过程中学到的是:约束工程做得越好,模型就可以越弱,”Elias说。“如果能把上下文提炼得足够充分,模型就不需要费太大力气去做正确的事。基本上,这是一个减少模糊性的过程。” 这使得Probably的数据科学工具可以在明显更小的AI模型上运行。Elias表示,当前版本运行的模型“比前沿模型弱四个级别”,这意味着它可以在本地硬件(即台式电脑而非数据中心)上运行,从而大幅降低与AI使用相关的token成本。 在token成本上升、许多客户重新评估AI预算(https://techcrunch.com/2026/06/09/can-tech-companies-learn-to-love-cheaper-models/ )的当下,这是一个受欢迎的理念。而且,Elias的想法不止于数据科学——同一引擎可以扩展到会计或医疗服务等用例,按Elias的说法,就是“任何对精度敏感的用例”。 “我认为非常有趣的是,大型AI实验室甚至都没有尝试过这条路,”Elias说。“他们没有动力去做,因为模型需要你多次纠正,他们才能赚到更多钱。” *通过我们文章中的链接购买产品,我们可能会获得少量佣金(https://techcrunch.com/techcrunch-affiliate-monetization-standards/ )。这并不影响我们的编辑独立性。* Russell Brandom自2012年开始报道科技行业,重点关注平台政策与新兴技术。他曾任职于The Verge和Rest of World,并为Wired、The Awl以及MIT Technology Review撰稿。联系方式:[email protected],或通过Signal联系:412-401-5489。 查看简介(https://techcrunch.com/author/russell-brandom/)

相似文章

为所有人扩展AI

OpenAI Blog

OpenAI宣布获得1100亿美元新融资,融资前估值为7300亿美元,融资方包括SoftBank、NVIDIA和Amazon等主要投资者,并建立战略合作伙伴关系以扩展计算能力和AI产品的全球覆盖范围。该融资旨在加速前沿AI在消费者、开发者和企业中的部署。