标签
本文介绍了结构化循环混合器(SRM),这是一种架构,无需专用内核即可在并行训练和循环推理之间进行代数转换。实验表明,与 Transformer 相比,SRM 实现了显著更高的吞吐量和并发能力,并在强化学习任务中表现出有效性能。