@AntLingAGI:发布 Ling-2.6-flash,104B 总参、7.4B 激活的稀疏指令模型
摘要
Ling-2.6-flash 是 104B 总参/7.4B 激活的稀疏指令模型,专为 token 效率优化,可在智能体任务中降低成本、提升吞吐。
推出 Ling-2.6-flash,一款拥有 104B 总参数、7.4B 激活参数的稀疏指令模型。它主打高 token 效率,拒绝冗余输出,在真实智能体任务中保持竞争力,同时帮助开发者降低成本、提升吞吐。
查看缓存全文
缓存时间: 2026/04/22 02:09
推出 Ling-2.6-flash:拥有 104B 总参数量、7.4B 激活参数量的指令模型。Ling-2.6-flash 专为高 token 效率设计,不生成冗余输出;在真实智能体任务中保持竞争力,同时帮助开发者降低成本、提升吞吐量。
相似文章
@AdinaYakup: Step-3.7-Flash 来自@StepFun_ai的新VL模型 198B/11B活跃参数 - MoE 256K上下文 3推理等级 高达400 tokens/秒
StepFun 发布了 Step-3.7-Flash,这是一个新的视觉语言 MoE 大模型,拥有 198B 参数(11B 激活),256K 上下文,推理速度高达 400 tokens/秒。
Ling与Ring 2.6技术报告:万亿参数规模下的高效即时Agentic智能
本技术报告介绍了Ling与Ring 2.6,这是一系列万亿参数规模的大语言模型,旨在实现高效且即时的Agentic智能。
stepfun-ai/Step-3.7-Flash
Step 3.7 Flash 是一个198B参数的稀疏MoE视觉语言模型,每个token有11B活跃参数,支持256k上下文和三种推理级别,专为高吞吐量的代理工作流设计。
@_akhaliq: 论文:
本技术报告介绍了Ling-2.6和Ring-2.6,这是一个万亿参数模型系列,旨在实现高效和即时的智能体智能,具有架构升级(如混合线性注意力)和专门的训练方法(包括KPop强化学习)。所有检查点均开源。
对于 Ling-2.6-1T,首先什么会让其规模显得合理:每个token的质量、本地服务的可行性,还是长上下文的稳定性?
文章质疑 Ling-2.6-1T 模型的规模是否在质量、本地服务可行性或长上下文稳定性方面合理,将其描述为一个开源 MoE 模型,总参数量达1T,原生上下文长度达1M。