那么...有人弄清楚Elephant Alpha到底是哪个公司的模型了吗?
摘要
社区正在讨论Elephant Alpha的身份,这是一个100B参数的模型,在OpenRouter上排名第一,拥有256K上下文窗口、快速推理速度和强大的编码能力,但中文支持较差,大家猜测可能是哪家公司开发的。
这个模型一直占据OpenRouter第一名,速度大约250 tps。它是一个100B参数的模型,上下文窗口为256K,中文支持出了名的差。显然,它针对编码和智能体任务进行了高度优化(指令遵循极其严格)。考虑到它的规格以及免费提供如此快速服务所需的计算量,背后可能的公司寥寥无几。感觉不像Google的模型(他们通常会公开参数量),而且糟糕的中文支持排除了Qwen/DeepSeek。我们是在看一个新的Cohere Command变体吗?或者是一个来自新创业公司的高度优化的MoE模型?目前的共识是什么?
相似文章
我猜 Ling-2.6-Flash 就是前几天闹得沸沸扬扬的隐身模型 Elephant Alpha
Ling-2.6-Flash 似乎正是此前传闻中引发关注的隐身模型“Elephant Alpha”
Claude Mythos、Deepseek v4、HappyHorse、Meta 新 AI、实时视频游戏:AI 新闻
Anthropic 公布被雪藏的 Claude Mythos 模型,可自主挖掘数千个 0-day;ZAI 开源 1.5 TB GLM-5.1,登顶开放权重基准;阿里巴巴未发布的 HappyHorse 视频模型冲上公开榜第一;Deepseek 放出“专家模式”v4 预览。
AI 新闻:让所有人震惊的模型来了!
Anthropic 尚未发布的 Claude Mythos 模型展现出顶级黑客与漏洞挖掘能力,公司正与多家科技巨头进行非公开预览,以便在正式发布前先修复软件漏洞。
@hank_aibtc: 家人们,本地 LLM太香了! 刷到 Hugging Face 上这个 gpt-oss-20b-tq3,真的有点上头! OpenAI 官方开源的 20B+ 参数 MoE 模型,被社区用 TurboQuant 3-bit 量化 + MLX 优…
The article highlights the gpt-oss-20b-tq3 model, a quantized version of an OpenAI MoE model that runs efficiently on standard 16GB MacBook Airs using TurboQuant and MLX optimizations.
@sudoingX:这台笔记本通过 Hermes agent 以 99% GPU 利用率本地跑 31B 模型,持续 15 tok/s,22.8 o…
一台笔记本借助 Hermes agent 本地运行 31B 模型,速度 15 tok/s,显存占用 22.8 GB,功耗 94 W,实现完全自主、私密、无需云端的 AI 推理。