meituan-longcat/LongCat-2.0
摘要
LongCat-2.0 是一个大规模 MoE 语言模型,总参数量 1.6 万亿,每个 token 激活约 48B 参数,使用 AI ASIC 超级计算集群和 1M 上下文数据训练而成。在编码和智能体任务上表现出色。
查看缓存全文
缓存时间: 2026/06/30 23:30
meituan-longcat/LongCat-2.0 · Hugging Face
来源:https://huggingface.co/meituan-longcat/LongCat-2.0 LongCat-2.0
Hugging Face (https://huggingface.co/meituan-longcat)
微信公众号 (https://github.com/meituan-longcat/LongCat-2.0/blob/main/figures/wechat_official_accounts.png)Twitter 关注 (https://x.com/Meituan_LongCat)
许可证 (https://huggingface.co/meituan-longcat/LICENSE)
技术博客📄 (https://longcat.chat/blog/longcat-2.0)
模型介绍
我们推出了 LongCat-2.0,这是一个大规模 MoE 语言模型,拥有 1.6 万亿总参数量,每个 token 激活约 480 亿参数——相比之前的 LongCat 模型有显著提升,并伴随多项架构改进。
完整的训练流程及大规模部署完全基于 AI ASIC 超级计算集群 完成。预训练阶段总计消耗数百万加速器小时,处理超过 35 万亿个 token,期间未出现回滚或无法恢复的损失尖峰——这证明了我们在替代硬件平台上进行前沿规模训练的能力。
为了增强模型在长程任务上的表现,我们引入了 LongCat 稀疏注意力机制,并使用包含数千亿 token 的 1M 上下文 数据训练 LongCat-2.0。结合专门的后期训练优化,LongCat-2.0 在编程和智能体任务上展现出强劲性能。
🏋️ 模型权重即将发布——敬请期待!
相似文章
@Meituan_LongCat:介绍 LongCat-2.0 1.6万亿参数 · MoE 约480亿活跃参数 · 100万上下文。这是 Owl Alpha 在 @OpenRouter 背后的完整模型…
Meituan 推出 LongCat-2.0,一个拥有 1.6万亿参数的 MoE 模型,约480亿活跃参数,支持100万上下文。该模型采用了 LongCat Sparse Attention 和 Zero-Compute Experts 等新颖架构,在编码和推理任务的基准测试中取得了优异成绩。
LongCat-2.0,大规模MoE模型,总参数量1.6万亿,激活参数480亿
LongCat-2.0是一个大规模混合专家(MoE)模型,总参数量1.6万亿,激活参数量480亿。
美团在API上推出1.6万亿参数的LongCat-2.0模型(2分钟阅读)
美团推出了LongCat-2.0,这是一个1.6万亿参数的混合专家模型,具有100万token的上下文窗口,可通过API用于智能编码、工具使用和复杂工作流。
@sheriyuo: 行业内首个万亿参数模型,在五万GPU中国集群上完成端到端训练与推理
美团发布了LongCat-2.0,一个1.6万亿参数的MoE模型,支持100万上下文,声称是首个在五万GPU中国集群上训练的模型,现已在OpenRouter上用于智能编码。
美团发布LongCat-2.0,中国首个基于国产芯片的万亿参数AI模型
美团发布了LongCat-2.0,一个完全基于国产芯片训练的1.6万亿参数AI模型,声称在编码和智能体基准测试上匹配或超越领先的专有模型。