trillion-parameter

#trillion-parameter

美团发布LongCat-2.0，中国首个基于国产芯片的万亿参数AI模型

Reddit r/singularity ↗ · 2小时前缓存

美团发布了LongCat-2.0，一个完全基于国产芯片训练的1.6万亿参数AI模型，声称在编码和智能体基准测试上匹配或超越领先的专有模型。

0 人收藏 0 人点赞

#trillion-parameter

@sheriyuo: 行业内首个万亿参数模型，在五万GPU中国集群上完成端到端训练与推理

X AI KOLs Timeline ↗ · 14小时前缓存

美团发布了LongCat-2.0，一个1.6万亿参数的MoE模型，支持100万上下文，声称是首个在五万GPU中国集群上训练的模型，现已在OpenRouter上用于智能编码。

0 人收藏 0 人点赞

#trillion-parameter

@_akhaliq: 论文:

X AI KOLs Following ↗ · 6天前缓存

本技术报告介绍了Ling-2.6和Ring-2.6，这是一个万亿参数模型系列，旨在实现高效和即时的智能体智能，具有架构升级（如混合线性注意力）和专门的训练方法（包括KPop强化学习）。所有检查点均开源。

0 人收藏 0 人点赞

#trillion-parameter

@samsja19: prime-rl 现在可以极快地训练1T参数的MoE模型，每步不到5分钟，约3天完成1000步。为实现这一...

X AI KOLs Following ↗ · 2026-06-23 缓存

Prime Intellect 发布了 prime-rl v0.6.0，实现了万亿参数MoE规模的强化学习，每步时间低于5分钟，并优化了推理、训练和推出流程。

0 人收藏 0 人点赞

#trillion-parameter

Ling与Ring 2.6技术报告：万亿参数规模下的高效即时Agentic智能

arXiv cs.CL ↗ · 2026-06-16 缓存

本技术报告介绍了Ling与Ring 2.6，这是一系列万亿参数规模的大语言模型，旨在实现高效且即时的Agentic智能。

0 人收藏 0 人点赞

#trillion-parameter

小米与TileRT在标准商用GPU上实现万亿参数模型推理速度超1000 TPS。定制芯片的时代结束了？

Reddit r/singularity ↗ · 2026-06-10

小米与TileRT使用标准商用GPU，在万亿参数模型上实现了每秒超过1000个token的推理速度，这显示了定制芯片之外的一个重要替代方案。

0 人收藏 0 人点赞

#trillion-parameter

中国小米的MiMo现在比ChatGPT和Claude快15倍（4分钟阅读）

TLDR AI ↗ · 2026-06-09 缓存

小米通过FP4量化和DFlash投机解码，在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度，性能超过GPT-5.5和Claude Opus 10倍以上。

0 人收藏 0 人点赞

#trillion-parameter

@zephyr_z9: 这太重要了，我认为这是第一个实用的推测解码方法，部署在大型准前沿模型上 M…

X AI KOLs Following ↗ · 2026-06-08 缓存

小米 MiMo 发布 MiMo-V2.5-Pro-UltraSpeed，通过推测解码在 1 万亿参数模型上实现每秒超过 1000 个 token，这是首次大规模实际部署如此速度。

0 人收藏 0 人点赞

#trillion-parameter

小米刚刚声称在标准8-GPU服务器上对1T模型实现了1000+ tps

Reddit r/LocalLLaMA ↗ · 2026-06-08 缓存

小米与TileRT合作发布了MiMo-V2.5-Pro-UltraSpeed，在1万亿参数模型上实现了超过1000 tokens/s的解码速度，支持实时AI交互，并加速了编程代理和推理任务。

0 人收藏 0 人点赞

#trillion-parameter

对于AI智能体，较重的推理预算应该优先用在何处：行动之前、状态变化之后，还是最终解释之前？

Reddit r/artificial ↗ · 2026-06-01

关于AI智能体中推理预算分配位置的讨论，引用了拥有高/极高推理努力模式的万亿参数模型Ring-2.6-1T。

0 人收藏 0 人点赞

#trillion-parameter

在智能体栈中，您会将哪一类失败优先路由到 Ring：工具选择错误、重新规划错误还是最终答案验证？

Reddit r/AI_Agents ↗ · 2026-05-31

关于将失败类别（工具选择错误、重新规划错误、最终答案验证）路由到 Ring-2.6-1T 的讨论，Ring-2.6-1T 是一个用于智能体工作流的万亿参数推理模型，具有高推理努力模式。

0 人收藏 0 人点赞

#trillion-parameter

你更愿意调整一个模型的推理深度，还是在两个模型之间切换？

Reddit r/AI_Agents ↗ · 2026-05-24

这是对使用单个可调深度的万亿参数推理模型（如 Ring-2.6-1T）与在多个专用模型之间切换这两种方案的权衡思考，探讨哪种方法对代理工作流更简洁或更具成本效益。

0 人收藏 0 人点赞

#trillion-parameter

@YRSM_Simon: 这是个大新闻！ kimi 2.6 是生成级的模型了，在 LLM 能力溢出的年代，速度要成为竞争的胜负手了，芯片领域又要“板块轮动”了吗

X AI KOLs Following ↗ · 2026-05-20 缓存

Cerebras is now running Kimi K2.6, a trillion-parameter model, in enterprise trials at ~1,000 tokens/s, the fastest frontier model performance ever measured by Artificial Analysis.

0 人收藏 0 人点赞

#trillion-parameter

@draecomino: Cerebras 创下新纪录：万亿参数模型，每秒 1000 个 token

X AI KOLs Timeline ↗ · 2026-05-19 缓存

Cerebras 宣布，在企业试用中，其运行万亿参数模型 Kimi K2.6 的速度约为每秒 1000 个 token，并声称这是 Artificial Analysis 有史以来测得的最快前沿模型性能。

0 人收藏 0 人点赞

#trillion-parameter

也许下一个模型的胜利在于降低智能体工作流的消耗

Reddit r/AI_Agents ↗ · 2026-05-19

文章讨论了下一个重要的模型进步可能在于降低智能体工作流的成本，重点介绍了蚂蚁集团的 Ling-2.6-1T，这是一个万亿参数模型，旨在以低计算开销实现高效推理和任务执行。

0 人收藏 0 人点赞

#trillion-parameter

inclusionAI/Ring-2.6-1T · Hugging Face

Reddit r/LocalLLaMA ↗ · 2026-05-14 缓存

inclusionAI发布了Ring-2.6-1T，一个万亿参数推理模型，具有增强的代理执行能力、推理努力机制和异步强化学习训练范式，旨在应对复杂的现实世界任务。

0 人收藏 0 人点赞

trillion-parameter

提交意见反馈