标签
本文介绍了TPA (Think, Plan, Ask),一种前瞻性多智能体对话框架,利用LLMs通过选择基于临床的提问策略,系统地揭示自闭症中潜在的社交语言障碍特征。它实现了82.1%的特征覆盖率,优于临床医生的真实临床对话。
本文研究了用于临床序数评分(画钟测试)的多模态LLM中的中央趋势偏差。研究发现,LLM将预测结果向量表中间压缩,对关键极端值造成不成比例的影响。该研究将LLM作为裁判的偏差文献扩展到临床评估领域,强调在部署前需要进行校准感知评估。