标签
Surya OCR是一款最先进的开源OCR模型,参数少于10亿(<1B),支持91种语言,在3B参数以下的基准测试中取得最高分。
本文识别了文档布局分析鲁棒性评估中的足迹偏差,并提出了一种结构感知的审计框架,该框架解耦了探针构建与路径归因,表明小规模的结构定向探针会导致与较大扰动相当的下游性能退化。