@VikParuchuri: 我们正在开源一个9B模型，它可以从文档中提取结构化数据，性能接近前沿水平。 - 90.2% 在我们基准测试上…

X AI KOLs Following 2026/06/19 12:04 模型

摘要

Vik Paruchuri 正在开源一个9B模型，该模型可以从文档中提取结构化数据，性能接近前沿水平（在其基准测试中达到90.2%，而Gemini 3.5 Flash为91.3%）。

我们正在开源一个9B模型，该模型从文档中提取结构化数据，性能接近前沿水平。 - 在我们的基准测试中达到90.2%，而Gemini 3.5 Flash为91.3% - 领先于NuExtract3等提取模型（81.5%） - 9.5秒的p50时间 - 通过JSON Schema https://t.co/zIdRbGjaY5

查看原文

查看缓存全文

缓存时间: 2026/06/20 14:35

我们正在开源一个9B参数的模型，能够以接近顶尖的性能从文档中提取结构化数据。

在我们的测试基准上达到90.2%，而Gemini 3.5 Flash为91.3%
领先于NuExtract3（81.5%）等提取模型
p50处理时间为9.5秒
通过JSON模式验证 https://t.co/zIdRbGjaY5

相似文章

@VikParuchuri: 我们正在推出 turbo mode 数据提取——比 Azure Content Understanding 快 5 倍、便宜 5 倍，且准确度高 7%……

X AI KOLs Following

VikParuchuri 宣布推出 turbo mode 数据提取，声称速度比 Azure Content Understanding 快 5 倍，成本低 5 倍，准确度提高 7%，并且实现了具有竞争力的延迟，适用于实时工作流。

@VikParuchuri：这是 lift（我们的开源提取模型）从一份杂乱的26页合同中提取结构化数据。

X AI KOLs Following

Vik Paruchuri 展示了 lift，一个能够从杂乱合同中提取结构化数据的开源提取模型。

我们一直在基准测试中挑选前沿模型，但这些测试条件与我们的实际部署环境并不相符。

Reddit r/AI_Agents

本文突出了 Claude Opus 和 Gemini Pro 在预测基准测试中的性能排名反转，具体取决于模型是自行进行网络搜索还是使用固定的证据。这表明，在研究阶段 Opus 表现出色，而 Gemini 在基于固定证据的判断方面更胜一筹，揭示了标准基准测试与实际部署条件之间的不匹配。

@VikParuchuri：本周我们将处理约 10 亿页内容。@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作……

X AI KOLs Following

DataLab 团队本周正在数千个 GPU 上编排 AI 模型，以处理约 10 亿页内容，彰显了显著的大规模文档处理能力。

@svpino：首次，我觉得开源权重模型已无法忽视。我们正处于这些模型具有竞争…

X AI KOLs Following

Santiago (@svpino) 强调 MiniMax-M2.7，一个 230B 参数的开源权重模型，能与 Opus 4.6 和 GPT-5.4 等顶级专有模型相抗衡，在 SambaNova 上以低成本实现 440+ tokens/s 的推理速度。

相似文章

@VikParuchuri: 我们正在推出 turbo mode 数据提取——比 Azure Content Understanding 快 5 倍、便宜 5 倍，且准确度高 7%……

@VikParuchuri：这是 lift（我们的开源提取模型）从一份杂乱的26页合同中提取结构化数据。

我们一直在基准测试中挑选前沿模型，但这些测试条件与我们的实际部署环境并不相符。

@VikParuchuri：本周我们将处理约 10 亿页内容。@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作……

@svpino：首次，我觉得开源权重模型已无法忽视。我们正处于这些模型具有竞争…

提交意见反馈