@atomic_chat_hq: Mistral OCR 4 将手写的微积分考试卷转化为干净的LaTeX!我们给它一张手写考试页面的照片。这…
摘要
Mistral OCR 4 将手写的微积分考试卷转换为干净的LaTeX,准确读取公式并处理图表,但不会重新绘制它们。该模型提供带有边界框和置信度分数的结构化输出,支持170种语言。
查看缓存全文
缓存时间: 2026/06/24 02:19
Mistral OCR 4 将一份手写微积分试卷转化成了整洁的 LaTeX!
我们给它拍了一张手写试卷页面的照片。该模型读懂了手写内容,并将每个公式重建为结构化的数字文本
输出:耗时:5.1秒 · 成本:$0.09
公式完全正确还原——最难的部分被攻克了。遗憾的是,图表没有被重绘。但这也正说明了问题:大多数 OCR 工具只是倾倒文本,然后悄悄丢掉图形。OCR 4 识别出了图表,为它添加了边框,并将其标注为图表。它没有被重绘,但被正确读取和计数了。
Mistral AI (@MistralAI): 介绍 Mistral OCR 4。它能以 170 种语言生成带边界框、块分类和内置信度分数的结构化输出。🧵👇
相似文章
@noctus91: Mistral OCR 4 读取一封 Henri Poincaré 1905 年的手写信件。历史手稿通常会导致OCR模型失效。T…
Mistral AI 发布了 Mistral OCR 4,该模型能够读取历史手写手稿,并提供边界框、块分类以及内联置信度分数,支持170种语言。
Mistral OCR 4
Mistral AI 发布了 Mistral OCR 4,一款紧凑型文档智能模型,能够提供边界框、块分类和内置信度评分,用于结构化文本提取。该模型支持170种语言,可在单个容器中运行以实现自托管部署,并与 Mistral Search Toolkit 集成,用于企业搜索和 RAG 管线。
@stevibe: Mistral OCR 4 刚刚发布,带边界框(他们最常要求的功能),所以我把它整合到了我的表单填充测试中……
Mistral OCR 4 已发布,带边界框这一被高度要求的功能。用户将其用于表单填充测试,发现效果不错,但并非完美。
arXiv上可访问数学的扩展:HTML转换与MathML 4
arXiv报告了其正在进行的HTML Papers项目,重点介绍了改进的转换保真度、达到75%无错误率的语料库级HTML转换、用于可访问语音的初步MathML 4 Intent注释,以及为降低成本而进行的LaTeXML的Rust移植。
@heynavtoor: Rongxin Ouyang 解决了每个非英语世界的研究人员一直在默默忍受的那个问题…
PDFMathTranslate 是一个开源工具,用于翻译科学PDF文件,同时保留数学公式、图表、表格和布局,已被EMNLP 2025接收,并在MIT许可下免费提供。