@aimlapi: Qwen3.7-Max on AI/ML API - 为智能体时代打造 GPQA Diamond (92.4), HMMT (97.1), Apex (44.5) 可持续运行35小时以上…
摘要
Qwen3.7-Max 是一款为智能体时代打造的新AI模型,在基准测试中取得优异成绩(GPQA Diamond 92.4, HMMT 97.1, Apex 44.5),可自主运行超过35小时,并支持与Claude Code和Qwen Code集成。
Qwen3.7-Max on AI/ML API - 为智能体时代打造
GPQA Diamond (92.4), HMMT (97.1), Apex (44.5)
可持续自主运行35小时以上
与Claude Code、Qwen Code等兼容
评论Qwen即可获取免费促销码 https://t.co/knScrnAlvV
查看缓存全文
缓存时间: 2026/05/22 04:08
Qwen3.7-Max 在 AI/ML API 上——专为智能体时代打造
GPQA Diamond(92.4)、HMMT(97.1)、Apex(44.5) 可持续自主执行 35 小时以上 兼容 Claude Code、Qwen Code 等
评论 Qwen 即可获取免费促销码 https://t.co/knScrnAlvV
相似文章
Seedance 2.5 宣传视频
一段展示Seedance 2.5(一款AI视频生成模型)能力的宣传视频。
GLM-5.2的人类评估
作者称赞GLM-5.2(一个MIT开源权重模型)在人类评估基准中表现出色,声称其能与Claude等最佳闭源模型相媲美。
Gemma 4 26b 为何不受关注?
一位用户询问为什么 Gemma 4 26b 相比 Qwen 模型关注度较低,并分享了他们在 3090 上使用这些模型构建个人助手项目的经验。
@Muennighoff:我们正在通过扩展到Opus/GPT级别、从头训练以及超越编码,开发一个更好的Composer模型!
Muennighoff宣布正在开发一个更好的Composer模型,扩展到Opus/GPT级别、从头训练,并超越编码,作为Cursor与SpaceX合作的一部分。
Gemma 4 有一天会成为下一个 Mistral(或 Qwen3.6)吗?关于微调不足的问题。
一篇分析文章,探讨为何 Gemma 4 尽管具备 QAT 与视觉支持等优势,却相比 Mistral 缺乏社区微调,以及社区惯性是否会最终发生转变。