icd-coding

#icd-coding

Can Post-Training Turn LLMs into Good Medical Coders? An Empirical Study of Generative ICD Coding

arXiv cs.CL ↗ · 2026-06-15 Cached

This empirical study investigates whether post-training (supervised fine-tuning and reinforcement learning) can improve LLMs' performance on automated ICD coding, introducing a diagnostic curriculum called PHI that extends GRPO to refine missed-code cases. Results show that prompting-only evaluation underestimates LLM potential, with SFT providing the main capability jump and RL further improving performance.

0 favorites 0 likes

icd-coding

Can Post-Training Turn LLMs into Good Medical Coders? An Empirical Study of Generative ICD Coding

Submit Feedback