那么...有人弄清楚Elephant Alpha到底是哪个公司的模型了吗?
摘要
社区正在讨论Elephant Alpha的身份,这是一个100B参数的模型,在OpenRouter上排名第一,拥有256K上下文窗口、快速推理速度和强大的编码能力,但中文支持较差,大家猜测可能是哪家公司开发的。
这个模型一直占据OpenRouter第一名,速度大约250 tps。它是一个100B参数的模型,上下文窗口为256K,中文支持出了名的差。显然,它针对编码和智能体任务进行了高度优化(指令遵循极其严格)。考虑到它的规格以及免费提供如此快速服务所需的计算量,背后可能的公司寥寥无几。感觉不像Google的模型(他们通常会公开参数量),而且糟糕的中文支持排除了Qwen/DeepSeek。我们是在看一个新的Cohere Command变体吗?或者是一个来自新创业公司的高度优化的MoE模型?目前的共识是什么?
相似文章
@rohanpaul_ai:我听说OpenRouter增长最快的智能体模型之一"Owl Alpha",实际上是美团LongCat-2.0-Preview……
Owl Alpha是OpenRouter上快速增长的智能体模型,据报道是美团LongCat-2.0-Preview的换皮版本,这是一个拥有1.6T参数的MoE模型,激活参数48B,支持1M token上下文窗口。它在使用量排名和增长率上表现突出。
@svpino:中国的人工智能生态系统与其他国家不同:每家公司都想发布自己的SOTA模型,但它们都…
该推文讨论了中国的人工智能生态系统,公司之间相互竞争但都发布开源模型。文中提到OpenRouter上出现了一个神秘模型'Owl Alpha',后被发现是美团的LongCat-2.0,这是一个1.6万亿参数模型,约480亿激活参数,针对推理和工具调用进行了优化。
我猜 Ling-2.6-Flash 就是前几天闹得沸沸扬扬的隐身模型 Elephant Alpha
Ling-2.6-Flash 似乎正是此前传闻中引发关注的隐身模型“Elephant Alpha”
神秘的Hy3 LLM以大幅优势领跑OpenRouter模型排行榜
来自腾讯的神秘模型Hy3意外地以token使用量领跑OpenRouter的LLM排行榜,尽管其基准测试表现平平且公众认知度低。本文利用OpenRouter的公开数据调查了这一异常现象。
@nathanhabib1011: SWE-bench_pro 上参数低于 128B 的最佳模型… @Alibaba_Qwen 3.6 27b 依然疯狂,紧随其后的是 @ornith_ 35B
推文突出了 SWE-bench_pro 基准测试中参数低于 128B 的顶级 AI 模型,指出阿里 Qwen 3.6 27B 和 ornith 35B 是领先的竞争者。