每当患者在德克萨斯大学医学分部(UTMB)进行CT扫描时,生成的图像会自动发送到心脏病科,由AI进行分析并分配一个心脏风险评分。只需几个月的时间,得益于一个简单的算法,AI已经标记了几个高心血管风险的患者。CT扫描不必与心脏有关,患者也不必有心脏问题。每次扫描都会自动触发评估。
这是一种由AI实现的简单预防性护理,使医疗机构能够开始利用其庞大的数据。UTMB的首席AI官彼得·麦卡弗里(Peter McCaffrey)告诉VentureBeat:“数据就在那里。我喜欢这一点是因为AI不需要做超人的事情。它执行的是低智力的任务,但处理量非常大,这仍然提供了很大的价值,因为我们不断发现我们错过的东西。”他承认,“我们知道我们会错过一些东西。在此之前,我们只是没有工具回去找到它们。”
AI如何帮助UTMB确定心血管风险
像许多医疗机构一样,UTMB正在多个领域应用AI。其中一个早期用例是心脏风险筛查。模型已经训练好,可以扫描偶然性冠状动脉钙化(iCAC),这是心血管风险的一个强预测因子。目标是识别那些可能被忽视的心脏病易感患者,因为他们没有明显的症状,麦卡弗里解释道。
通过这个筛查程序,该机构完成的每一次CT扫描都会自动使用AI来检测冠状动脉钙化。扫描不必与心脏病有关;可能是由于脊椎骨折或异常肺结节而进行的。扫描被输入一个基于图像的卷积神经网络(CNN),该网络计算Agatston评分,代表患者动脉中的斑块积累。通常,这将由人类放射科医生计算,麦卡弗里解释说。
从那里,AI根据额外信息(如是否服用他汀类药物或是否曾看过心脏病专家)将iCAC评分为100或以上的患者分配到三个“风险等级”。麦卡弗里解释说,这种分配是基于规则的,可以从电子健康记录(EHR)中提取离散值,或者AI可以通过处理临床访问笔记等自由文本使用GPT-4o来确定值。
iCAC评分在100或以上且无已知心脏病就诊史或治疗史的患者会自动收到数字消息。系统还会向他们的主治医生发送通知。iCAC评分为300或更高的患者也会接到电话。麦卡弗里解释说,几乎所有一切都是自动化的,除了电话;然而,该机构正在积极试点工具,希望也能自动化语音呼叫。唯一需要人工介入的地方是在确认AI得出的钙化评分和风险等级之前进行的自动通知。
自2024年底启动该计划以来,该医疗机构每月评估约450次扫描,其中每月有五到十个病例被识别为高风险,需要干预,麦卡弗里报告说。“这里的关键是没有人需要怀疑你患有这种疾病,也没有人需要为此疾病安排检查。”他说。
为医生争取宝贵的几分钟
另一个关键的AI用例是中风和肺栓塞的检测。UTMB使用专门训练的算法,可以在几秒钟内识别特定症状并提醒护理团队,以加速治疗。类似于iCAC评分工具,分别针对中风和肺栓塞训练的CNN会自动接收CT扫描并寻找血流受阻或血管突然截断等指标。“人类放射科医生可以检测这些视觉特征,但在这里,检测是自动化的,只需要几秒钟,”麦卡弗里说。
任何因“疑似”中风或肺栓塞而进行的CT扫描都会自动发送给AI——例如,急诊室的临床医生可能会识别面部下垂或口齿不清,并发出“CT中风”命令,触发算法。两个算法都包括一个消息应用程序,一旦发现结果就会立即通知整个护理团队。这将包括一张带有十字线标记病变位置的图像截图。
“这些都是特别紧急的情况,治疗速度至关重要,”麦卡弗里说。“我们看到过几次因为AI更快地提醒我们而赢得了数分钟的干预时间。”
减少幻觉和锚定偏差
为了确保模型尽可能优化,UTMB会在部署前后对模型进行敏感性、特异性、F-1得分、偏差等因素的验证。例如,在预部署阶段,iCAC算法通过在一组平衡的CT扫描上运行模型并由放射科医生手动评分来进行验证——然后将两者进行比较。而在部署后审查中,放射科医生会被提供一组随机的AI评分CT扫描,并进行盲法下的完整iCAC测量。麦卡弗里解释说,这允许他的团队反复计算模型误差并检测潜在偏差(这将表现为误差幅度和/或方向的变化)。
为了防止锚定偏差——即AI和人类过于依赖他们遇到的第一条信息,从而在决策时忽略重要细节——UTMB采用了一种“同伴学习”技术。选择一部分放射学检查,随机打乱、匿名化并分发给不同的放射科医生,然后比较他们的答案。这不仅有助于评估个别放射科医生的表现,还可以检测在使用AI专门突出特定异常的情况下,遗漏发现率是否更高(从而导致锚定偏差)。例如,如果AI用于识别并在X光片上标记骨骨折,团队会查看是否有骨骨折标记的研究中其他因素(如关节间隙狭窄,常见于关节炎)的遗漏率是否增加。
麦卡弗里和他的团队发现,连续的模型版本在同一类别(各种版本的GPT-4o)和跨类别(GPT-4.5 vs GPT-3.5)中往往具有较低的幻觉率。“但这不是零也不是确定性的——因此,虽然很好,但我们不能忽视幻觉的可能性及其影响,”他说。因此,他们通常倾向于使用能够很好地引用来源的生成式AI工具。例如,一个模型可以总结患者的病程,同时显示作为其输出基础的临床笔记。“这使提供者能够有效地充当防止幻觉的保障,”麦卡弗里说。
标记“基本内容”以增强医疗保健
UTMB还在其他几个领域利用AI,包括一个自动系统,帮助医务人员确定住院是否合理。该系统作为一个副驾,自动从EHR中提取所有患者笔记,并使用Claude、GPT和Gemini进行总结和检查,然后向工作人员呈现评估。“这让我们的人员可以查看整个患者群体,并筛选/分类患者,”麦卡弗里解释道。该工具还协助人员起草支持住院或观察的文档。
在其他方面,AI用于重新审查诸如超声心动图解释或临床笔记等报告,并识别护理中的差距。在许多情况下,“这只是标记基本内容,”麦卡弗里说。医疗保健非常复杂,数据来自各个方面——图像、医生笔记、实验室结果——但很少有数据被计算,因为人力不足。这导致了他所说的“巨大的智力瓶颈”。大量数据没有被计算,即使有很大的潜力可以更早地发现问题。“这不是对某个地方的指责,”麦卡弗里强调。“这只是医疗保健的一般状态。”没有AI,“你无法以所需的规模部署智能、审查和思考工作来捕捉一切。”
(全文结束)


