page-level

#page-level

跨时间僧伽罗语OCR：页面级自适应与历时分析

arXiv cs.CL ↗ · 4天前缓存

本文介绍了 sinhala-ocr-lk-acts-1010，这是首个公开可用的真实场景页面级僧伽罗语OCR数据集，并使用QLoRA对三种视觉语言模型（DeepSeek-OCR V1、DeepSeek-OCR V2、LightOnOCR-2-1B）进行了微调。LightOnOCR-2-1B实现了1.05%的字符错误率（CER），优于开源和商业OCR模型，并在不同时期的退化文档中保持了稳定的性能。

0 人收藏 0 人点赞

page-level

跨时间僧伽罗语OCR：页面级自适应与历时分析

提交意见反馈