PDFMathTranslate: 保留版式的科学文档翻译工具
摘要
本文介绍PDFMathTranslate,一款基于大语言模型和精准版式检测技术的开源科学文档翻译工具,可在翻译过程中保留原文档的版式。
查看缓存全文
缓存时间: 2026/05/08 09:06
论文页面 - PDFMathTranslate:保留排版的科学文档翻译
来源:https://huggingface.co/papers/2507.03009
摘要
PDFMathTranslate 利用大语言模型和精确的版面检测技术,实现保留排版的科学文档翻译,在精度、灵活性和效率方面均有提升。
语言障碍阻碍了科学文档的传播与科学技术的发展。然而,此前针对此类文档的翻译工作在很大程度上忽略了版面信息。为填补这一空白,我们推出了 PDFMathTranslate——全球首款用于翻译科学文档并保留其版面的开源软件。借助大语言模型和精确版面检测的最新进展,我们在精度、灵活性和效率方面为社区带来了关键改进。该项目已在 https://github.com/byaidu/pdfmathtranslate 开源,下载量超过 222k 次。
查看 arXiv 页面 (https://arxiv.org/abs/2507.03009) 查看 PDF (https://arxiv.org/pdf/2507.03009) GitHub 33.6k stars (https://github.com/byaidu/pdfmathtranslate) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2507.03009)
在您的智能体中获取这篇论文:
hf papers read 2507.03009
还没有安装最新版 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型 0
暂无模型引用该论文
在模型 README.md 中引用 arxiv.org/abs/2507.03009,即可从此页面链接。
引用该论文的数据集 0
暂无数据集引用该论文
在数据集 README.md 中引用 arxiv.org/abs/2507.03009,即可从此页面链接。
引用该论文的 Spaces 0
暂无 Space 引用该论文
在 Space README.md 中引用 arxiv.org/abs/2507.03009,即可从此页面链接。
包含该论文的收藏 0
暂无收藏包含该论文
将该论文添加到收藏 (https://huggingface.co/new-collection),即可从此页面链接。
相似文章
@heynavtoor: Rongxin Ouyang 解决了每个非英语世界的研究人员一直在默默忍受的那个问题…
PDFMathTranslate 是一个开源工具,用于翻译科学PDF文件,同时保留数学公式、图表、表格和布局,已被EMNLP 2025接收,并在MIT许可下免费提供。
ForMaT:视觉引导的多语言PDF翻译数据集
本文介绍了ForMaT,一个包含15个语言对、3,956个PDF文件的平行语料库,专为视觉引导的多语言翻译而设计,保留了布局元数据,用于对布局感知的机器翻译系统进行基准测试。
@jerryjliu0:LiteParse,我们的开源文档解析器,在将复杂 PDF 布局、文本和表格解析为清晰的空间网格方面表现出色……
LiteParse 是一款基于启发式规则的开源 PDF 解析器,无需依赖 ML 模型即可快速将复杂布局、文本和表格转换为整洁的空间网格。
PaperFit:用于科学文档的视觉闭环排版优化
本文介绍了 PaperFit,这是一种视觉闭环智能体,能够迭代诊断并修复 LaTeX 文档中的布局缺陷,以生成可用于出版的 PDF。此外,本文还提出了一个新基准 PaperFit-Bench,用于评估视觉排版优化的性能。
dots.ocr:单个视觉语言模型中的多语言文档布局解析
本文介绍了 dots.ocr,一个统一的视觉语言模型,它联合学习布局检测、文本识别和关系理解,用于多语言文档布局解析。它在 OmniDocBench 上取得了最先进的结果,并引入了覆盖 126 种语言的 XDocParse 基准。