标签
美团发布了LongCat-2.0,一个完全基于国产芯片训练的1.6万亿参数AI模型,声称在编码和智能体基准测试上匹配或超越领先的专有模型。
美团发布了LongCat-2.0,一个1.6万亿参数的MoE模型,支持100万上下文,声称是首个在五万GPU中国集群上训练的模型,现已在OpenRouter上用于智能编码。
本技术报告介绍了Ling-2.6和Ring-2.6,这是一个万亿参数模型系列,旨在实现高效和即时的智能体智能,具有架构升级(如混合线性注意力)和专门的训练方法(包括KPop强化学习)。所有检查点均开源。
Prime Intellect 发布了 prime-rl v0.6.0,实现了万亿参数MoE规模的强化学习,每步时间低于5分钟,并优化了推理、训练和推出流程。
本技术报告介绍了Ling与Ring 2.6,这是一系列万亿参数规模的大语言模型,旨在实现高效且即时的Agentic智能。
小米与TileRT使用标准商用GPU,在万亿参数模型上实现了每秒超过1000个token的推理速度,这显示了定制芯片之外的一个重要替代方案。
小米通过FP4量化和DFlash投机解码,在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度,性能超过GPT-5.5和Claude Opus 10倍以上。
小米 MiMo 发布 MiMo-V2.5-Pro-UltraSpeed,通过推测解码在 1 万亿参数模型上实现每秒超过 1000 个 token,这是首次大规模实际部署如此速度。
小米与TileRT合作发布了MiMo-V2.5-Pro-UltraSpeed,在1万亿参数模型上实现了超过1000 tokens/s的解码速度,支持实时AI交互,并加速了编程代理和推理任务。
关于AI智能体中推理预算分配位置的讨论,引用了拥有高/极高推理努力模式的万亿参数模型Ring-2.6-1T。
关于将失败类别(工具选择错误、重新规划错误、最终答案验证)路由到 Ring-2.6-1T 的讨论,Ring-2.6-1T 是一个用于智能体工作流的万亿参数推理模型,具有高推理努力模式。
这是对使用单个可调深度的万亿参数推理模型(如 Ring-2.6-1T)与在多个专用模型之间切换这两种方案的权衡思考,探讨哪种方法对代理工作流更简洁或更具成本效益。
Cerebras is now running Kimi K2.6, a trillion-parameter model, in enterprise trials at ~1,000 tokens/s, the fastest frontier model performance ever measured by Artificial Analysis.
Cerebras 宣布,在企业试用中,其运行万亿参数模型 Kimi K2.6 的速度约为每秒 1000 个 token,并声称这是 Artificial Analysis 有史以来测得的最快前沿模型性能。
文章讨论了下一个重要的模型进步可能在于降低智能体工作流的成本,重点介绍了蚂蚁集团的 Ling-2.6-1T,这是一个万亿参数模型,旨在以低计算开销实现高效推理和任务执行。
inclusionAI发布了Ring-2.6-1T,一个万亿参数推理模型,具有增强的代理执行能力、推理努力机制和异步强化学习训练范式,旨在应对复杂的现实世界任务。