BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
text-correction
标签
Cards
List
#text-correction
CSRP: 通过强化学习结合效率感知奖励进行中文文本纠错的思维链推理
arXiv cs.CL
↗
· 2天前
缓存
CSRP提出了一个三阶段框架,结合持续预训练、思维链监督微调和带有效率感知奖励的强化学习,以解决中文语法纠错中的过度纠正问题,在NACGEC基准上取得了最先进的结果。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交