标签
CopT为大型语言模型引入了一种对比性在线思考框架,首先生成草稿答案,然后通过对比验证和动态思考来提高准确性并减少token消耗。在数学、代码和智能体推理任务上,准确率最高提升23%,token使用量最多降低57%。
ELF提出了一种基于嵌入空间和流匹配的连续扩散语言模型,在更少的采样步骤下性能优于现有的离散和连续扩散语言模型。