Probably 获得 900 万美元融资,构建更可靠的人工智能
摘要
Probably 从 Andreessen Horowitz 获得 900 万美元种子轮融资,通过确定性验证器系统捕获 LLM 幻觉,构建更可靠的人工智能系统,使小型模型能够在本地硬件上运行。
Probably 旨在防止幻觉和事实错误传递给用户,并达到与确定性系统相当的准确性。
查看缓存全文
缓存时间: 2026/06/16 14:33
# Probably 融资900万美元,构建更可靠的AI | TechCrunch
来源:https://techcrunch.com/2026/06/16/probably-raises-9m-to-build-a-more-reliable-kind-of-ai/
随着LLM越来越强大,幻觉问题却顽固地难以根除。即使最聪明的模型也会出现错误,虽然有一些方法可以捕捉这些错误,但业界仍在摸索最佳方案。
刚刚从Andreessen Horowitz获得900万美元种子轮融资的** Probably**(https://www.probably.dev/ )正试图构建一种更严谨的错误捕捉方法。
正如创始人Peter Elias(上图所示)所说,公司的目标是防止幻觉和简单事实错误传播到用户端,并实现确定性系统中常见的99.99%准确率——这一水平在AI中要难得多。事实证明,要让LLM达到这一准确率,需要重新思考AI工程的许多基本假设。
Probably的首款产品是一款数据科学工具,旨在从复杂数据集中快速给出答案。每个结果都附带引用和生成路径的审计追踪,这在AI工具中已越来越常见。
但要防止错误混入这些摘要,需要一套精密的约束系统——Elias将其描述为“数据科学机甲套装”。LLM的初步答案会与一个确定性验证系统进行核对,任何与数据集不符的结果都会被驳回。该公司表示,关键在于LLM已经过验证器的训练,并且整个系统针对快速准确的答案进行了优化。
“我们在构建过程中学到的是:约束工程做得越好,模型就可以越弱,”Elias说。“如果能把上下文提炼得足够充分,模型就不需要费太大力气去做正确的事。基本上,这是一个减少模糊性的过程。”
这使得Probably的数据科学工具可以在明显更小的AI模型上运行。Elias表示,当前版本运行的模型“比前沿模型弱四个级别”,这意味着它可以在本地硬件(即台式电脑而非数据中心)上运行,从而大幅降低与AI使用相关的token成本。
在token成本上升、许多客户重新评估AI预算(https://techcrunch.com/2026/06/09/can-tech-companies-learn-to-love-cheaper-models/ )的当下,这是一个受欢迎的理念。而且,Elias的想法不止于数据科学——同一引擎可以扩展到会计或医疗服务等用例,按Elias的说法,就是“任何对精度敏感的用例”。
“我认为非常有趣的是,大型AI实验室甚至都没有尝试过这条路,”Elias说。“他们没有动力去做,因为模型需要你多次纠正,他们才能赚到更多钱。”
*通过我们文章中的链接购买产品,我们可能会获得少量佣金(https://techcrunch.com/techcrunch-affiliate-monetization-standards/ )。这并不影响我们的编辑独立性。*
Russell Brandom自2012年开始报道科技行业,重点关注平台政策与新兴技术。他曾任职于The Verge和Rest of World,并为Wired、The Awl以及MIT Technology Review撰稿。联系方式:[email protected],或通过Signal联系:412-401-5489。
查看简介(https://techcrunch.com/author/russell-brandom/)
相似文章
ZeroDrift 获 1000 万美元融资,保护 AI 模型免于自毁
ZeroDrift 获得 1000 万美元种子轮融资,提供一项 AI 合规服务,该服务位于模型与用户之间,能够确定性地标记并重写不合规消息。
@LinusEkenstam: Pre, Seed, A,B,C,D,E,F,G…. Series H 融资650亿美元,估值高达9650亿美元
Anthropic 完成了 Series H 轮融资,募资650亿美元,投后估值9650亿美元,由 Altimeter Capital、Dragoneer、Greenoaks 和 Sequoia 领投,旨在推进 AI 研究并扩大 Claude 的算力容量。
Hark完成7亿美元A轮融资,打造神秘的“通用”AI界面
Hark是一家神秘的AI实验室,正在构建通用AI界面和硬件,以60亿美元估值完成7亿美元A轮融资。公司计划今年夏天发布其首个多模态模型,并招募硬件和AI研究领域的顶尖人才。
AI成本的很大一部分只是模型一遍又一遍地重读相同的文本。有趣的修复尝试,带有公开证明
Corbenic AI声称为大语言模型提供无损KV缓存重用,允许存储的模型内存在不同机器和GPU代际之间逐比特恢复,并通过公开校验和进行验证。该项目包括一个开源的小模型,训练成本约600欧元,使整个流程可审查。
为所有人扩展AI
OpenAI宣布获得1100亿美元新融资,融资前估值为7300亿美元,融资方包括SoftBank、NVIDIA和Amazon等主要投资者,并建立战略合作伙伴关系以扩展计算能力和AI产品的全球覆盖范围。该融资旨在加速前沿AI在消费者、开发者和企业中的部署。