标签
本文证明,与仅使用标签的微调相比,在阿尔茨海默病检测中,使用合成理由数据进行监督微调在多种配置和模型家族中始终损害预测性能。尽管理由质量很高,这种退化仍然存在,并归因于叙事合理性与判别优化之间的结构性冲突。