reflection-internalization

标签

Cards List
#reflection-internalization

ReflectMT:将反思内化为高效高质量机器翻译

arXiv cs.CL · 2026-04-22 缓存

ReflectMT提出两阶段强化学习方法,让大推理模型把反思能力内化,实现单次高质量翻译,比DeepSeek-R1等多步推理模型少用94%的token。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈