@VikParuchuri: 我们正在开源一个9B模型,它可以从文档中提取结构化数据,性能接近前沿水平。 - 90.2% 在我们基准测试上…
摘要
Vik Paruchuri 正在开源一个9B模型,该模型可以从文档中提取结构化数据,性能接近前沿水平(在其基准测试中达到90.2%,而Gemini 3.5 Flash为91.3%)。
我们正在开源一个9B模型,该模型从文档中提取结构化数据,性能接近前沿水平。
- 在我们的基准测试中达到90.2%,而Gemini 3.5 Flash为91.3%
- 领先于NuExtract3等提取模型(81.5%)
- 9.5秒的p50时间
- 通过JSON Schema https://t.co/zIdRbGjaY5
查看缓存全文
缓存时间: 2026/06/20 14:35
我们正在开源一个9B参数的模型,能够以接近顶尖的性能从文档中提取结构化数据。
- 在我们的测试基准上达到90.2%,而Gemini 3.5 Flash为91.3%
- 领先于NuExtract3(81.5%)等提取模型
- p50处理时间为9.5秒
- 通过JSON模式验证 https://t.co/zIdRbGjaY5
相似文章
@VikParuchuri: 我们正在推出 turbo mode 数据提取——比 Azure Content Understanding 快 5 倍、便宜 5 倍,且准确度高 7%……
VikParuchuri 宣布推出 turbo mode 数据提取,声称速度比 Azure Content Understanding 快 5 倍,成本低 5 倍,准确度提高 7%,并且实现了具有竞争力的延迟,适用于实时工作流。
@VikParuchuri:这是 lift(我们的开源提取模型)从一份杂乱的26页合同中提取结构化数据。
Vik Paruchuri 展示了 lift,一个能够从杂乱合同中提取结构化数据的开源提取模型。
我们一直在基准测试中挑选前沿模型,但这些测试条件与我们的实际部署环境并不相符。
本文突出了 Claude Opus 和 Gemini Pro 在预测基准测试中的性能排名反转,具体取决于模型是自行进行网络搜索还是使用固定的证据。这表明,在研究阶段 Opus 表现出色,而 Gemini 在基于固定证据的判断方面更胜一筹,揭示了标准基准测试与实际部署条件之间的不匹配。
@VikParuchuri:本周我们将处理约 10 亿页内容。@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作……
DataLab 团队本周正在数千个 GPU 上编排 AI 模型,以处理约 10 亿页内容,彰显了显著的大规模文档处理能力。
@svpino:首次,我觉得开源权重模型已无法忽视。我们正处于这些模型具有竞争…
Santiago (@svpino) 强调 MiniMax-M2.7,一个 230B 参数的开源权重模型,能与 Opus 4.6 和 GPT-5.4 等顶级专有模型相抗衡,在 SambaNova 上以低成本实现 440+ tokens/s 的推理速度。