@VikParuchuri: 我们正在推出 turbo mode 数据提取——比 Azure Content Understanding 快 5 倍、便宜 5 倍,且准确度高 7%……
摘要
VikParuchuri 宣布推出 turbo mode 数据提取,声称速度比 Azure Content Understanding 快 5 倍,成本低 5 倍,准确度提高 7%,并且实现了具有竞争力的延迟,适用于实时工作流。
查看缓存全文
缓存时间: 2026/06/17 21:59
我们推出了涡轮模式数据提取功能——比 Azure Content Understanding 快 5 倍,成本低 5 倍,准确率提高 7%。
在 1-30 页的文档上,p50 为 4.5 秒,p90 为 7 秒——足以满足实时用户流程。https://t.co/V3YAquiJKq
相似文章
@VikParuchuri: 我们正在开源一个9B模型,它可以从文档中提取结构化数据,性能接近前沿水平。 - 90.2% 在我们基准测试上…
Vik Paruchuri 正在开源一个9B模型,该模型可以从文档中提取结构化数据,性能接近前沿水平(在其基准测试中达到90.2%,而Gemini 3.5 Flash为91.3%)。
@MSFTResearch: 30倍加速分析,从SQL自动生成GPU内核,AI匹配实验室培养的肿瘤模型用于癌症治…
微软研究院在最新的Research Focus通讯中重点介绍了多项进展,包括使用CoddSpeed实现30倍加速分析、AI野生动物重新识别,以及无需重新训练即可跨任务学习的LLM。
@VikParuchuri: Datalab 平衡模式提取现已在内部基准测试中达到 95.9% 的准确率——比 Reducto Deep Extract 更精准(…
Datalab 的平衡模式提取在内部基准测试中实现了 95.9% 的准确率,超越 Reducto Deep Extract(95.1%),而价格不到其一半,并提供包含引用和推理的完整验证。
@vintcessun: 1000万向量31GB压到4GB,搜索还比FAISS快——这事有点离谱,但turbovec真做到了。核心是Google TurboQuant的数据无关量化,无需训练、不用调参,加向量即索引。手写NEON/AVX-512核实打实快12-20…
turbovec 基于 Google TurboQuant 算法,将 1000 万向量从 31GB 压缩到 4GB,搜索速度比 FAISS 快 12-20%,支持过滤搜索,提供 Rust 实现和 Python 包。
TurboOCR v3 — 高速文档OCR服务器 (C++/CUDA),在RTX 5090上约520张/秒
TurboOCR v3 是一款自托管的高速OCR服务器,在RTX 5090上使用PP-OCRv6模型实现约每秒520张图片的处理速度,并新增了表格和公式的结构化解析功能。