那么...有人弄清楚Elephant Alpha到底是哪个公司的模型了吗?

Reddit r/singularity 新闻

摘要

社区正在讨论Elephant Alpha的身份,这是一个100B参数的模型,在OpenRouter上排名第一,拥有256K上下文窗口、快速推理速度和强大的编码能力,但中文支持较差,大家猜测可能是哪家公司开发的。

这个模型一直占据OpenRouter第一名,速度大约250 tps。它是一个100B参数的模型,上下文窗口为256K,中文支持出了名的差。显然,它针对编码和智能体任务进行了高度优化(指令遵循极其严格)。考虑到它的规格以及免费提供如此快速服务所需的计算量,背后可能的公司寥寥无几。感觉不像Google的模型(他们通常会公开参数量),而且糟糕的中文支持排除了Qwen/DeepSeek。我们是在看一个新的Cohere Command变体吗?或者是一个来自新创业公司的高度优化的MoE模型?目前的共识是什么?
查看原文

相似文章

AI 新闻:让所有人震惊的模型来了!

YouTube AI Channels

Anthropic 尚未发布的 Claude Mythos 模型展现出顶级黑客与漏洞挖掘能力,公司正与多家科技巨头进行非公开预览,以便在正式发布前先修复软件漏洞。