page-level

标签

Cards List
#page-level

跨时间僧伽罗语OCR:页面级自适应与历时分析

arXiv cs.CL · 4天前 缓存

本文介绍了 sinhala-ocr-lk-acts-1010,这是首个公开可用的真实场景页面级僧伽罗语OCR数据集,并使用QLoRA对三种视觉语言模型(DeepSeek-OCR V1、DeepSeek-OCR V2、LightOnOCR-2-1B)进行了微调。LightOnOCR-2-1B实现了1.05%的字符错误率(CER),优于开源和商业OCR模型,并在不同时期的退化文档中保持了稳定的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈