text-rich-networks

标签

Cards List
#text-rich-networks

TRN-R1-Zero:仅通过强化学习实现富文本网络推理

arXiv cs.CL · 2026-04-22 缓存

TRN-R1-Zero 提出一种后训练框架,让大模型在无需监督微调或思维链数据的情况下,仅凭强化学习即可对富文本网络进行零样本推理。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈