ai-rater

#ai-rater

AI Rater Discrimination Depends on Scoring Protocol in Complex Clinical Decision-Making

arXiv cs.CL ↗ · 2026-06-03 Cached

This study examines how AI raters (LLMs) score clinical AI outputs under different protocols in complex type 2 diabetes pharmacotherapy, finding that rubric-anchored scoring provides greater discriminative power than rubric-free scoring.

0 favorites 0 likes

ai-rater

AI Rater Discrimination Depends on Scoring Protocol in Complex Clinical Decision-Making

Submit Feedback