text-rich-networks

标签

#text-rich-networks

TRN-R1-Zero：仅通过强化学习实现富文本网络推理

arXiv cs.CL ↗ · 2026-04-22 缓存

TRN-R1-Zero 提出一种后训练框架，让大模型在无需监督微调或思维链数据的情况下，仅凭强化学习即可对富文本网络进行零样本推理。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈