@VikParuchuri: Datalab 平衡模式提取现已在内部基准测试中达到 95.9% 的准确率——比 Reducto Deep Extract 更精准（…

X AI KOLs Timeline 2026/06/27 18:38 工具

data-extraction benchmark accuracy pricing verification datalab

摘要

Datalab 的平衡模式提取在内部基准测试中实现了 95.9% 的准确率，超越 Reducto Deep Extract（95.1%），而价格不到其一半，并提供包含引用和推理的完整验证。

Datalab 平衡模式提取现已在我们的内部基准测试中达到 95.9% 的准确率——比 Reducto Deep Extract（95.1%）更精准，价格不到其一半。我们提供包含引用和推理的完整验证，让您清楚知道哪些数值需要手动检查。https://t.co/UNUBkB23Ll

查看原文

查看缓存全文

缓存时间: 2026/06/27 21:59

Datalab平衡模式提取在我们的内部基准测试中得分95.9%，比Reducto Deep Extract（95.1%）更准确，价格却不到其一半。

我们提供完整的验证，包含引用和推理说明，让你清楚知道哪些值需要手动检查。https://t.co/UNUBkB23Ll

相似文章

X AI KOLs Following

Vik Paruchuri 正在开源一个9B模型，该模型可以从文档中提取结构化数据，性能接近前沿水平（在其基准测试中达到90.2%，而Gemini 3.5 Flash为91.3%）。

X AI KOLs Following

VikParuchuri 宣布推出 turbo mode 数据提取，声称速度比 Azure Content Understanding 快 5 倍，成本低 5 倍，准确度提高 7%，并且实现了具有竞争力的延迟，适用于实时工作流。

Reddit r/MachineLearning

对 18 款大模型在 OCR 任务上的全面评测（7k+ 次调用）发现，便宜或旧模型往往能以极低成本达到与旗舰模型相当的准确率，数据集与评测框架已完全开源。

X AI KOLs Following

在子采样OBLIQ-bench上测试搜索的早期结果显示，Mixedbread的重排序器获得了较强的MRR，有时在某些指标上优于GPT 5.5，且速度更快，但该基准测试仍具有挑战性。

X AI KOLs Timeline

Apodex 发布了 Apodex-1.0，一个深度研究模型，它使用一个带有全局验证的重型代理团队，在包括 BrowseComp、DeepSearchQA 和 HLE 在内的多个基准测试中取得了最先进的结果。