ttcw

#ttcw

When Reasoning Supervision Hurts: TTCW-Based Long-Form Literary Review Generation

arXiv cs.CL ↗ · 2026-05-21 Cached

This paper constructs a large dataset of 263,911 long-form stories annotated with TTCW-based creativity metrics and fine-tunes Qwen3 models to generate structured review reports. It finds that non-reasoning fine-tuning outperforms reasoning-supervised fine-tuning, which suffers from parse failures and irrelevant repetition.

0 favorites 0 likes

ttcw

When Reasoning Supervision Hurts: TTCW-Based Long-Form Literary Review Generation

Submit Feedback