cognitive-alignment

标签

Cards List
#cognitive-alignment

Mental-R1:对齐LLM推理用于心理健康评估

arXiv cs.AI · 2026-06-12 缓存

提出认知相对策略优化(CRPO),一种用于对齐大语言模型在心理健康评估中推理的强化学习框架,在加权F1分数上比现有基线平均提高10.4个百分点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈