@_akhaliq: 论文:

X AI KOLs Following 论文

摘要

本技术报告介绍了Ling-2.6和Ring-2.6,这是一个万亿参数模型系列,旨在实现高效和即时的智能体智能,具有架构升级(如混合线性注意力)和专门的训练方法(包括KPop强化学习)。所有检查点均开源。

论文:https://t.co/NH8TYhD0Yf
查看原文
查看缓存全文

缓存时间: 2026/06/23 19:53

论文:https://t.co/NH8TYhD0Yf


论文页面 - Ling 和 Ring 2.6 技术报告:高效且即时的大规模智能体智能

来源:https://huggingface.co/papers/2606.15079 作者:

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

,

摘要

Ling-2.6 和 Ring-2.6 模型被提出作为智能体智能的可扩展解决方案,具备架构升级和专门的训练方法,以平衡快速响应时间与高级推理能力。

高效且可扩展的智能体智能需要既能提供低延迟响应又能具备强大推理能力的模型,同时在实际训练、服务和部署中保持实用性。在本报告中,我们介绍了 Ling-2.6 和 Ring-2.6,这是一系列旨在大规模解决这一挑战的模型。Ling-2.6 针对即时响应生成和高每个输出token能力进行了优化,而 Ring-2.6 则专为更深层次的推理和更高级的智能体工作流程而设计。我们并非从头开始训练,而是通过架构迁移预训练(https://huggingface.co/papers?q=architectural%20migration%20pre-training)和大规模后训练来升级 Ling-2.0 基础模型。此次升级由一个统一的协同设计指导,涵盖模型架构、优化目标、服务系统和智能体训练环境,从而在模型能力和部署效率两方面都实现改进。在架构层面,我们引入了一种混合线性注意力设计,将 Lightning Attention(https://huggingface.co/papers?q=Lightning%20Attention)与 MLA(https://huggingface.co/papers?q=MLA)相结合,提高了长上下文训练和解码的效率。为了进一步提升token效率,我们通过进化式思维链(https://huggingface.co/papers?q=Evolutionary%20Chain-of-Thought)、语言单元策略优化(https://huggingface.co/papers?q=Linguistic%20Unit%20Policy%20Optimization)、双向偏好对齐(https://huggingface.co/papers?q=bidirectional%20preference%20alignment)以及最短正确响应蒸馏(https://huggingface.co/papers?q=shortest-correct-response%20distillation)来优化每个输出token的能力。对于智能体能力,我们提出了 KPop(https://huggingface.co/papers?q=KPop),这是一个强化学习框架(https://huggingface.co/papers?q=reinforcement%20learning%20framework),旨在支持 Ring-2.6-1T 在大规模环境基础数据上的稳定训练。KPop(https://huggingface.co/papers?q=KPop)通过跨编码、搜索、工具使用和工作流程执行的异步调度(https://huggingface.co/papers?q=asynchronous%20scheduling)提高了训练效率,从而能够从复杂的智能体-环境交互(https://huggingface.co/papers?q=agent-environment%20interactions)中进行可扩展学习。Ling-2.6 和 Ring-2.6 共同为高效、可扩展且开放的智能体系统提供了一条实用路径。我们开源了 2.6 系列中的所有检查点,以支持实际智能体智能领域的进一步研究和开发。

查看 arXiv 页面(https://arxiv.org/abs/2606.15079)查看 PDF(https://arxiv.org/pdf/2606.15079)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.15079)

引用本论文的模型(5个)

inclusionAI/Ling-2.6-flash 文本生成• 107B• 7天前更新• 10.8k • 497 (https://huggingface.co/inclusionAI/Ling-2.6-flash)

inclusionAI/Ling-2.6-1T 文本生成• 1T• 7天前更新• 538 • 472 (https://huggingface.co/inclusionAI/Ling-2.6-1T)

inclusionAI/Ring-2.6-1T 文本生成• 1T• 7天前更新• 1.34k • 102 (https://huggingface.co/inclusionAI/Ring-2.6-1T)

inclusionAI/Ling-2.6-1T-base 文本生成• 1T• 1天前更新• 229 • 13 (https://huggingface.co/inclusionAI/Ling-2.6-1T-base)

浏览所有引用本论文的模型(5个)(https://huggingface.co/models?other=arxiv:2606.15079)

引用本论文的数据集(0个)

没有与本论文关联的数据集

请在数据集的 README.md 中引用 arxiv.org/abs/2606.15079,以便在此页面中链接它。

引用本论文的 Spaces(19个)

浏览所有引用本论文的 Spaces(19个)(https://huggingface.co/spaces?arxivIds=2606.15079)

包含本论文的收藏(3个)

相似文章

Ring-2.6-1T 在真实世界智能体任务中达到 SOTA 水平

Reddit r/ArtificialInteligence

蚂蚁集团发布了 Ring-2.6-1T,这是一个拥有 1 万亿参数的推理模型,专为智能体工作流设计,采用 MIT 许可证、扩展上下文,并使用了异步强化学习 (Async RL) 和 IcePop 训练方法,取得了最先进的成果。