document-intelligence

标签

Cards List
#document-intelligence

@akshay_pachaar: - <1B参数 - 支持91种语言 - RTX 5090上每秒5页 - 可在CPU、GPU、MPS上运行 - 83.3% olmocr基准得分(3B以下最高)…

X AI KOLs Following · 5天前 缓存

Surya OCR是一款最先进的开源OCR模型,参数少于10亿(<1B),支持91种语言,在3B参数以下的基准测试中取得最高分。

0 人收藏 0 人点赞
#document-intelligence

文档解析器如何崩溃?审计文档智能中的结构脆弱性

arXiv cs.CL · 2026-05-20 缓存

本文识别了文档布局分析鲁棒性评估中的足迹偏差,并提出了一种结构感知的审计框架,该框架解耦了探针构建与路径归因,表明小规模的结构定向探针会导致与较大扰动相当的下游性能退化。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈