临床试验中人工智能与人机交互的趋势——一种混合人机探索
摘要
本文采用GPT-5.5混合人机方法,分析了ClinicalTrials.gov中临床试验AI术语的时间与地理趋势。研究发现AI相关试验数量增加,中国和美国领先,并讨论了混合筛选对人机交互分类的可行性。
arXiv:2605.29096v1 公告类型:新
摘要:本文考察从ClinicalTrials.gov注册库中检索的记录,以描述AI术语的时间趋势以及人工智能试验的地理分布。本工作还报告了一种探索性混合人机方法,用于分析注册临床试验中的人机交互趋势。混合工作流程包括前沿生成式AI模型(GPT-5.5)和人工审查,以筛选和分类基于AI搜索返回的记录。研究结果表明,随着时间的推移,AI相关试验显著增加,近期在机器学习、深度学习、聊天机器人、GPTs和大语言模型方面的引用有所增长。地理上,中国和美国占AI相关试验数量最多,近期意大利、法国、西班牙、英国和土耳其(Türkiye)等多个其他国家也有显著增长。在随机抽取的100条记录样本中,人类和AI分类器在识别未实质性使用AI的研究方面表现出良好的一致性,但在分类人机交互(尤其是健康专业人员交互模糊或描述不足的情况)方面一致性较低。总体而言,结果表明混合人机筛选临床试验记录具有潜在可行性,但更清晰的试验报告和更精确的交互定义将有助于改进这一过程。
查看缓存全文
缓存时间: 2026/05/29 09:13
# 临床实验中人工智能与人机交互的趋势——基于人机协同的探索性研究 来源:https://arxiv.org/abs/2605.29096 查看PDF (https://arxiv.org/pdf/2605.29096) > 摘要:本文分析了从 clinicaltrials.gov (http://clinicaltrials.gov/) 注册库中检索到的记录,以刻画AI术语的时间变化趋势及AI试验的地理分布特征。同时,本文还报告了一种探索性的人机协同方法,用于分析已注册临床试验中的人机交互趋势。该人机协同工作流程采用前沿生成式AI模型(GPT-5.5)与人工审核相结合的方式,对AI相关检索结果进行筛选与分类。研究发现,AI相关试验数量随时间显著增长,近年来涉及机器学习、深度学习、聊天机器人、GPTs及大语言模型的引用明显增加。从地理分布来看,中国和美国占据AI相关试验的最大份额,而意大利、法国、西班牙、英国和土耳其(Türkiye)等国家近年来的增长也较为显著。在随机抽取的100条记录样本中,人工分类器与AI分类器在识别未实质性使用AI的研究方面一致性较高,但在人机交互分类方面一致性较低——尤其在健康专业人员交互描述模糊或不充分的情况下。总体而言,结果表明人机协同筛选临床试验记录具有潜在可行性,但更清晰的试验报告和更精确的交互定义将有助于提升该流程的效果。 ## 提交历史 来自:Tim Collins [查看邮件 (https://arxiv.org/show-email/a622cc52/2605.29096)] **[v1]** 2026年5月27日星期三 20:56:36 UTC (472 KB)
相似文章
利用AI改进患者对临床试验的获取途径
Paradigm 利用 GPT-4 的自然语言理解能力,显著改进了临床试验的患者筛选流程。相比传统人工审核每天约50名患者,该方案能够每分钟评估数百名患者,大幅减轻临床医生的工作负担,并改进患者获取治疗方案的机会。
不完全合作的人-AI交互:模拟与用户研究中人类和AI属性影响的比较
本研究论文调查了人类个性特征和AI设计特性在不完全合作场景中对人-AI交互的联合影响,采用模拟数据集(2000次模拟)和人类受试者实验(290名参与者)两种方法。研究发现模拟与真实交互之间存在显著差异,其中AI透明度在实际人-AI交互中成为关键因素。
用于改进临床试验工作流程准确性和效率的AI辅助协议信息提取
Banting Health AI的研究人员展示了一个利用生成式大语言模型和检索增强生成(RAG)技术进行临床试验协议信息自动提取的AI系统,准确率达89%,相比独立LLM的62.6%有显著提升,AI辅助工作流程任务完成速度快40%,并降低认知负荷。
用代理式AI重振全球医疗的人性化
医疗保健提供者正转向代理式AI,实现复杂任务自动化,减轻临床医生倦怠,改善患者预后,如HSS利用AI代理处理保险理赔和患者分诊所示。
衡量关键指标:医疗保健中生成式、多模态及智能体AI的基准测试
本文提出了一个针对医疗保健领域生成式、多模态及智能体AI进行基准测试的结构化框架,旨在解决高基准得分与实际临床可靠性、安全性和相关性之间的差距。