为了更快地招募临床试验志愿者,美国国立卫生研究院(NIH)的一组研究人员转向了人工智能。科学家们构建了一个大型语言模型——TrialGPT,该模型可以扫描患者的医疗摘要,并将他们匹配到符合条件的临床试验中。这项研究结果于11月18日发表在《自然通讯》上。
“我们的研究表明,TrialGPT可以帮助临床医生更高效地将患者连接到临床试验机会,节省宝贵的时间,这些时间可以更好地用于需要人类专业知识的更复杂任务。”研究作者、NIH国家医学图书馆高级研究员Zhiyong Lu博士在11月18日的新闻发布会上表示。
Lu及其同事通过测试三个公开可用的合成患者队列评估了TrialGPT,这些队列总共包括183名患者,此前这些患者已被匹配到临床试验中。合成患者是从现实世界数据生成的,以模拟真实患者的特点。AI模型为每个患者生成关键词,并使用这些关键词将他们与ClinicalTrials.gov系统中的研究进行匹配;然后生成一个总结,说明患者是否适合试验人群及其原因。
总体而言,TrialGPT正确匹配患者到试验的准确率为87.3%,研究作者指出,这一准确率接近人类专家的范围(88.7%至90%)。研究人员还要求两名临床医生审查六名患者的总结,并评估他们是否有资格参加六个临床试验。其中一名临床医生手动进行筛查,而另一名则使用TrialGPT;使用该模型使筛查时间加快了40%,而不会损失准确性。
当匹配患者到试验时,模型主要犯了四种错误。最常见的错误类型占所有错误的30.7%,即TrialGPT因认为没有足够的信息来判断患者是否适合某个试验而做出错误结论,实际上是有足够信息的。其他错误源于模型缺乏医学知识,例如错误地认为心脏导管插入术与中心静脉穿刺相同,并因此排除了一名曾接受过心脏导管插入术的患者参与试验。这两种程序是不同的,该患者本应有资格参加试验。
根据2023年另一项NIH研究,多达85%的临床试验未能招募到足够的患者以维持所需的样本量进行统计分析,尽管每年在招募上花费约19亿美元。研究人员现在正在现实世界的临床环境中测试TrialGPT,作为2024年主任挑战创新奖的一部分。
(全文结束)


