@NielsRogge:在 http://paperswithcode.co 上,你可以看到 Mythos 5 在流行的图表理解基准 CharXiv 上被一个 4B 开源模型超越……

X AI KOLs Following 模型

摘要

一个4B开源模型在 CharXiv 图表理解基准上击败了 Mythos 5,展示了可自由获取的小模型的强大性能。

在 https://t.co/tOqTY2ZA6h 上,你可以看到 Mythos 5 在流行的图表理解基准 CharXiv 上被一个4B开源模型击败 一个在 @huggingface 上可自由获取的小型模型,可以部署在任何地方!https://t.co/e1BPGGE2JW
查看原文
查看缓存全文

缓存时间: 2026/06/10 13:50

在 https://t.co/tOqTY2ZA6h 上,你可以看到 Mythos 5 被一个 4B 开源模型在 CharXiv(一个流行的图表理解基准测试)上击败。

一个可在 @huggingface 上免费获取、可在任何地方部署的小型模型!https://t.co/e1BPGGE2JW

相似文章

@AnthropicAI:每次发布新模型时,我们都会运行相同的测试:给模型一段训练小型AI模型的代码,要求新模型对其进行加速。

X AI KOLs

Anthropic 分享了内部基准测试结果,展示了AI编码能力的显著提升:2024年5月,Claude Opus 4 在机器学习代码优化任务上平均加速约3倍;而今年4月发布的新模型 Mythos Preview 达到了约52倍加速,相比之下,一位熟练人类工程师需要4-8小时才能实现4倍加速。