cognitive-alignment

#cognitive-alignment

Mental-R1: Aligning LLM Reasoning for Mental Health Assessment

arXiv cs.AI ↗ · 2026-06-12 Cached

Proposes Cognitive Relative Policy Optimization (CRPO), a reinforcement learning framework for aligning LLM reasoning in mental health assessment, achieving an average improvement of 10.4 percentage points in weighted F1-score over existing baselines.

0 favorites 0 likes

cognitive-alignment

Mental-R1: Aligning LLM Reasoning for Mental Health Assessment

Submit Feedback