hybrid-models

#hybrid-models

互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型

arXiv cs.CL ↗ · 2026-04-21 缓存

# 互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型来源：[https://arxiv.org/html/2604.16378](https://arxiv.org/html/2604.16378) Yunshuo Tian¹, Akayou Kitessa¹, Tanuja Chitnis², 和 Yijun Zhao¹ 1 纽约市福特汉姆大学计算机与信息科学系 2 马萨诸塞州波士顿市Mass General Brigham医院神经科 ###### 摘要大型语言模型 \(LLMs\) 与经典机器学习方法提供互补...

0 人收藏 0 人点赞

#hybrid-models

Olmo Hybrid：从理论到实践再回到理论

arXiv cs.CL ↗ · 2026-04-20 缓存

本论文介绍了Olmo Hybrid，一个包含70亿参数的语言模型，结合了注意力机制和Gated DeltaNet递归层，相比纯Transformer架构展现出理论和实证优势。该工作表明混合模型具有更强的表达能力，在预训练中扩展效率更高，且性能优于可比的Transformer基线。

0 人收藏 0 人点赞

hybrid-models

互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型

Olmo Hybrid：从理论到实践再回到理论

提交意见反馈