@atomic_chat_hq: 开放权重 MiniMax M3 通过驾照照片填写美国海关表格 本次测试中,我们部署了MiniMax M3…
摘要
使用Mac Studio上的MLX-VLM对开放权重MiniMax M3模型进行的测试表明,它能够从驾照照片和扫描文档中自动读取信息,并通过工具调用填写字段、复选框和签名,自主完成美国海关表格的填写。
查看缓存全文
缓存时间: 2026/06/15 21:09
开源权重模型 MiniMax M3 通过驾照照片填写美国海关申报表
此次测试中,我们在配备 512GB 内存的 Mac Studio M3 Ultra 上使用 MLX-VLM 部署了 MiniMax M3 Q4。模型的任务是读取扫描文档和身份证照片,然后填写一份申报表。
输出:736 个 token · 输入:1,847 个 token · 耗时:约 31 秒
模型分析了两份输入,流式输出推理过程,然后调用了三个工具:write_field 用于文本字段,mark 用于是/否复选框,以及 sign 用于签名和日期。它提取了所需信息,映射到正确的字段,并在没有任何手动输入的情况下完成了表单。
相似文章
MiniMax M3 现已在 HuggingChat 上可用(支持 Artifacts)
MiniMax M3 模型现已在 HuggingChat 上可用,这是一个支持 Artifacts 的开源 AI 聊天应用。
MiniMax M3(2分钟阅读)
MiniMax 推出了 M3,这是首个结合编程、智能体与多模态能力的开源权重模型,通过稀疏注意力机制支持高达 100 万 token 的上下文。
通过API在三个真实的机器学习和编程工作流中测试MiniMax M2.7
一位开发者通过API在三个实际的机器学习和编程工作流中测试了MiniMax M2.7模型,并评估了其性能。
@PrajwalTomar_: 大家又在忽视MiniMax了。他们刚刚发布了M3。首个结合前沿编码、1…
MiniMax发布了M3,一个开放权重模型,结合了前沿编码、1M上下文和原生多模态能力,性能与Opus相当,但成本仅为其一小部分。
MiniMax 承诺在发布百万上下文模型后公开 M3 权重(2 分钟阅读)
MiniMax 通过 API 发布了 M3,这是一款拥有 100 万 token 上下文窗口并支持原生多模态输入的模型。该公司承诺在 10 天内发布开源权重和技术报告。