structured-recurrent-mixer

标签

Cards List
#structured-recurrent-mixer

用于大规模并行序列生成的结构化循环混合器

arXiv cs.CL · 4天前 缓存

本文介绍了结构化循环混合器(SRM),这是一种架构,无需专用内核即可在并行训练和循环推理之间进行代数转换。实验表明,与 Transformer 相比,SRM 实现了显著更高的吞吐量和并发能力,并在强化学习任务中表现出有效性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈