misleading-context

#misleading-context

测量LLMs在误导性医疗语境下的认知韧性

Hugging Face Daily Papers ↗ · 2026-06-10 缓存

介绍了MedMisBench，用于测量LLMs在误导性语境下维持正确医疗推理的能力。结果显示，在对抗性条件下，准确率从71.1%骤降至38.0%，临床专家组指出存在潜在危害。

0 人收藏 0 人点赞