text-correction

标签

Cards List
#text-correction

CSRP: 通过强化学习结合效率感知奖励进行中文文本纠错的思维链推理

arXiv cs.CL · 2天前 缓存

CSRP提出了一个三阶段框架,结合持续预训练、思维链监督微调和带有效率感知奖励的强化学习,以解决中文语法纠错中的过度纠正问题,在NACGEC基准上取得了最先进的结果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈