reasoning-supervision

标签

Cards List
#reasoning-supervision

当推理监督适得其反:基于TTCW的长篇文学评论生成

arXiv cs.CL · 2026-05-21 缓存

本文构建了一个包含263,911篇长篇小说的大型数据集,这些故事通过基于TTCW的创造力指标进行了标注,并对Qwen3模型进行微调以生成结构化的评论报告。研究发现,非推理微调优于推理监督微调,后者容易出现解析失败和不相关的重复。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈