@atomic_chat_hq: Mistral OCR 4 将手写的微积分考试卷转化为干净的LaTeX!我们给它一张手写考试页面的照片。这…

X AI KOLs Timeline 模型

摘要

Mistral OCR 4 将手写的微积分考试卷转换为干净的LaTeX,准确读取公式并处理图表,但不会重新绘制它们。该模型提供带有边界框和置信度分数的结构化输出,支持170种语言。

Mistral OCR 4 将手写的微积分考试卷转化为干净的LaTeX! 我们给它一张手写考试页面的照片。模型读取了手写内容,并将每个公式重建为结构化的数字文本。 输出:时间:5.1秒 · 成本:$0.09 公式完全正确——难点被完美攻克。遗憾的是,图表没有被重新绘制。但关键在于:大多数OCR工具只是提取文本,然后悄悄地忽略图像。OCR 4 捕捉到了图表,将其框出,并标记为图表。图表不会被重新绘制,但它被读取并记录在案。
查看原文
查看缓存全文

缓存时间: 2026/06/24 02:19

Mistral OCR 4 将一份手写微积分试卷转化成了整洁的 LaTeX!

我们给它拍了一张手写试卷页面的照片。该模型读懂了手写内容,并将每个公式重建为结构化的数字文本

输出:耗时:5.1秒 · 成本:$0.09

公式完全正确还原——最难的部分被攻克了。遗憾的是,图表没有被重绘。但这也正说明了问题:大多数 OCR 工具只是倾倒文本,然后悄悄丢掉图形。OCR 4 识别出了图表,为它添加了边框,并将其标注为图表。它没有被重绘,但被正确读取和计数了。

Mistral AI (@MistralAI): 介绍 Mistral OCR 4。它能以 170 种语言生成带边界框、块分类和内置信度分数的结构化输出。🧵👇

相似文章

Mistral OCR 4

Hacker News Top

Mistral AI 发布了 Mistral OCR 4,一款紧凑型文档智能模型,能够提供边界框、块分类和内置信度评分,用于结构化文本提取。该模型支持170种语言,可在单个容器中运行以实现自托管部署,并与 Mistral Search Toolkit 集成,用于企业搜索和 RAG 管线。

arXiv上可访问数学的扩展:HTML转换与MathML 4

arXiv cs.CL

arXiv报告了其正在进行的HTML Papers项目,重点介绍了改进的转换保真度、达到75%无错误率的语料库级HTML转换、用于可访问语音的初步MathML 4 Intent注释,以及为降低成本而进行的LaTeXML的Rust移植。