reflection-internalization

标签

#reflection-internalization

ReflectMT：将反思内化为高效高质量机器翻译

arXiv cs.CL ↗ · 2026-04-22 缓存

ReflectMT提出两阶段强化学习方法，让大推理模型把反思能力内化，实现单次高质量翻译，比DeepSeek-R1等多步推理模型少用94%的token。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈