我猜 Ling-2.6-Flash 就是前几天闹得沸沸扬扬的隐身模型 Elephant Alpha
摘要
Ling-2.6-Flash 似乎正是此前传闻中引发关注的隐身模型“Elephant Alpha”
基本确定就是它
相似文章
那么...有人弄清楚Elephant Alpha到底是哪个公司的模型了吗?
社区正在讨论Elephant Alpha的身份,这是一个100B参数的模型,在OpenRouter上排名第一,拥有256K上下文窗口、快速推理速度和强大的编码能力,但中文支持较差,大家猜测可能是哪家公司开发的。
@AntLingAGI:发布 Ling-2.6-flash,104B 总参、7.4B 激活的稀疏指令模型
Ling-2.6-flash 是 104B 总参/7.4B 激活的稀疏指令模型,专为 token 效率优化,可在智能体任务中降低成本、提升吞吐。
@_akhaliq: 论文:
本技术报告介绍了Ling-2.6和Ring-2.6,这是一个万亿参数模型系列,旨在实现高效和即时的智能体智能,具有架构升级(如混合线性注意力)和专门的训练方法(包括KPop强化学习)。所有检查点均开源。
ascend-tribe/openPangu-2.0-Flash(他们尚未上传至HuggingFace)
openPangu-2.0-Flash 是一个 92B MoE 模型,激活参数为 6B,上下文长度为 512k,在昇腾上使用 34T tokens 训练,融合了慢速/快速思维以及多个RL训练阶段。
OpenAI 隐秘模型发布?
关于OpenAI在arena.ai上可能发布了一个名为kyros-alpha的隐秘模型的猜测,该模型生成的图像能通过OpenAI的Verify检测,但表现出一些非典型特征。