reasoning-supervision

#reasoning-supervision

当推理监督适得其反：基于TTCW的长篇文学评论生成

arXiv cs.CL ↗ · 2026-05-21 缓存

本文构建了一个包含263,911篇长篇小说的大型数据集，这些故事通过基于TTCW的创造力指标进行了标注，并对Qwen3模型进行微调以生成结构化的评论报告。研究发现，非推理微调优于推理监督微调，后者容易出现解析失败和不相关的重复。

0 人收藏 0 人点赞