cognitive-alignment

标签

#cognitive-alignment

Mental-R1：对齐LLM推理用于心理健康评估

arXiv cs.AI ↗ · 2026-06-12 缓存

提出认知相对策略优化（CRPO），一种用于对齐大语言模型在心理健康评估中推理的强化学习框架，在加权F1分数上比现有基线平均提高10.4个百分点。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈