text-correction

#text-correction

CSRP: 通过强化学习结合效率感知奖励进行中文文本纠错的思维链推理

arXiv cs.CL ↗ · 2天前缓存

CSRP提出了一个三阶段框架，结合持续预训练、思维链监督微调和带有效率感知奖励的强化学习，以解决中文语法纠错中的过度纠正问题，在NACGEC基准上取得了最先进的结果。

0 人收藏 0 人点赞