hybrid-models

标签

Cards List
#hybrid-models

PE-MHL:用于复杂系统可扩展学习的物理编码模块化混合层

arXiv cs.LG · 2天前

本文提出PE-MHL,一种物理编码模块化混合层框架,通过数据驱动子模型逐步优化基于物理的模型,提供理论收敛保证,并在控制基准测试中优于单一网络。

0 人收藏 0 人点赞
#hybrid-models

风功率预测中当前架构的系统评估

arXiv cs.LG · 3天前 缓存

本文系统综述了区间风速预测的混合方法,结合深度学习、模态分解和统计方法以提高预测精度和可靠性。

0 人收藏 0 人点赞
#hybrid-models

互惠协同训练(RCT):通过强化学习耦合基于梯度与不可微模型

arXiv cs.CL · 2026-04-21 缓存

# 互惠协同训练(RCT):通过强化学习耦合基于梯度与不可微模型 来源:[https://arxiv.org/html/2604.16378](https://arxiv.org/html/2604.16378) Yunshuo Tian¹, Akayou Kitessa¹, Tanuja Chitnis², 和 Yijun Zhao¹ 1 纽约市福特汉姆大学计算机与信息科学系 2 马萨诸塞州波士顿市Mass General Brigham医院神经科 ###### 摘要 大型语言模型 \(LLMs\) 与经典机器学习方法提供互补...

0 人收藏 0 人点赞
#hybrid-models

Olmo Hybrid:从理论到实践再回到理论

arXiv cs.CL · 2026-04-20 缓存

本论文介绍了Olmo Hybrid,一个包含70亿参数的语言模型,结合了注意力机制和Gated DeltaNet递归层,相比纯Transformer架构展现出理论和实证优势。该工作表明混合模型具有更强的表达能力,在预训练中扩展效率更高,且性能优于可比的Transformer基线。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈