人工智能(AI)已经在改变医疗创新和药物发现的方式,例如通过预测可被新药物靶向的蛋白质结构,或从大型化学库中识别新型抗生素类别,这些成果经常登上新闻头条。但实验室中的发现往往不足以使新治疗方法可用于解决患者的关键需求。从实验室到临床应用的过程因患者招募和结果测量耗时而延迟。AI有望大幅加快这两个过程,降低突破性创新的障碍。
需要披露的是,两位作者均存在利益冲突。我们中的一位(K.B.)在一家大型制药公司担任董事会成员;另一位(Z.O.)是一家风险投资支持的初创企业的联合创始人兼首席科学家,该公司为生命科学公司开发AI工具。这些经历与我们的学术研究共同塑造了我们的观点。
对于许多主要的死亡和致残原因——癌症、痴呆症等——预防性或早期治疗手段非常有限。尽管这些疾病在人群层面上造成了巨大的负担,但它们的发展过程往往跨越很长的时间。这使得在临床试验中难以测量最终结果:在当今成本已经很高的试验中可行的2-3年随访期内,普通人群中这些疾病的发病率很低。因此,即使治疗方法非常有效,试验也必须规模非常大或持续很长时间才能检测到结果的变化,这使得数据收集既昂贵又缓慢。安全标准也更高:旨在用于早期干预或疾病预防的治疗方法需要招募健康人群,而对健康人群的安全风险容忍度很低。这种组合使得赞助商远离预防性治疗,而倾向于更窄范围、更短期的适应症,Budish、Roin和Williams在他们的癌症试验分析中记录了这一点。
为避免需要大样本或数十年的随访,许多人提出了替代终点:可以更快或更容易测量的、代表最终健康结果的代理指标。然而,替代终点的记录令人清醒。许多在替代终点上显示出明显益处的治疗方法,即使这些替代终点与下游结果有直观和机制上的联系,最终也对这些替代终点所代表的健康结果有害。仅举几个逻辑替代终点失败的例子:抑制心室搏动增加了心肌梗死后死亡率;托塞曲匹(torcetrapib)提高了高密度脂蛋白但增加了死亡率;罗格列酮(rosiglitazone)降低了血糖但增加了糖尿病患者的心脏病发作;控制心房颤动导致的并发症比仅降低心率更多。经验教训不是替代终点是徒劳的,而是在因果理解不完整的复杂系统中,它们是脆弱的。
AI提供了一种不同的、基于经验的寻找替代终点的方法,这种方法不依赖于因果理解,而是广泛测量因果因素——甚至是人类尚未知晓的因素。考虑一个思想实验:描述身体当前生理状况的综合数据集共同预测未来结果的准确性很高。如果该读数足够全面,那么通过改变当前生理状况来改变未来结果的治疗方法也会改变该读数。而且,关键的是,即使不知道哪些元素在变化或为什么变化,正如最近在统计学和计量经济学中的研究所示,基于该读数预测的结果将与药物的最终效果成比例地变化。这种使用生理数据(图像、波形、复杂时间序列)的替代指数只能使用机器学习构建,因为传统方法无法处理如此高维的数据。
基于关于身体当前状态的复杂生理数据(如心电图(ECGs)、影像学、实验室结果和临床笔记)的AI预测提供了这样一种读数。因为这些数据可用于数百万患者,并且可以与纵向结果相关联,AI可用于预测各种结果。例如,考虑一组微妙的心电图发现,可能未被传统分析工具识别,但在其他正常心电图中预测未来心房颤动。这样的预测可以通过两种方式加速预防性治疗的临床试验。首先,它们可以识别未来心房颤动发生率较高的高风险人群亚组——在最近的一项研究中为40%至60%,而人群发生率为2%至3%——从而使试验规模更小、成本更低,但仍具有足够的统计效力。其次,心电图波形本身可以用作替代终点,因为它们可以转化为对未来心房颤动的校准良好的概率。与最终结果——实际未来心房颤动——不同,心电图可以立即并反复测量。这不仅更快地生成结果,还允许更精确地识别基于个体内部变化(治疗前和治疗后)以及治疗-对照差异的治疗效果。
当然,这种方法也有重要的注意事项和局限性。AI替代终点仍然是替代终点,针对真实终点的临床评估仍然至关重要。如果药物改变了预测因子与最终结果之间的关系,或者药物效应在当前数据中未被测量(例如,特异性的晚期毒性效应),替代终点将无法预测药物的真实效果。此外,如果训练数据反映了历史差异,替代终点可能会复制这些差异,因此必须检查其在不同亚组中的表现。要知道替代终点是否具有因果有效性,只有一种方法:进行试验并测量对真实结果的影响。尽管如此,替代终点在最终试验之前的准备工作中可能非常有帮助。研究人员和赞助商必须确定哪些药物开发项目值得投资,以及如何设计针对"无药可用"疾病的下一代临床试验;监管机构必须考虑如何将AI预测纳入试验设计,以支持对尚无可用治疗的高负担疾病的突破性研究。
AI革命必将极大地加速医学发现。但仅靠蛋白质折叠和分子设计无法将新治疗方法带给患者,如果不解决最长的延迟环节:招募和评估临床试验。尽管存在重要注意事项,但在临床试验中使用AI——预测以加速和更好地定位招募、从可获取数据生成精细校准的结果,以及在更短的时间范围内确定安全性和有效性——可以降低成本,加速创新,并为患者解锁巨大益处。
文章信息
发布日期:2026年4月16日。doi:10.1001/jamahealthforum.2026.1596
开放获取:本文是在CC-BY-NC-ND许可条款下发布的开放获取文章,该许可不允许修改或商业使用,包括用于文本和数据挖掘、AI训练和类似技术。© 2026 Baicker K等。《JAMA Health Forum》。
通讯作者:Katherine Baicker, PhD, 芝加哥大学教务长, 5801 S. Ellis Avene, Chicago, IL 60637 ([email protected])。
利益冲突披露:Baicker博士报告在礼来公司董事会任职,并在提交工作之外担任梅奥诊所受托人。Obermeyer博士报告在提交工作之外是Dandelion Health的联合创始人兼首席科学家。
参考文献
- Press A, Teslo R. AI won't automatically accelerate clinical trials. Substack. February 27, 2026. Accessed March 1, 2026.
- Budish E, Roin BN, Williams HL. Patents and research investments: assessing the empirical evidence. Am Econ Rev. 2016;106(5):183-187.
- Cardiac Arrhythmia Suppression Trial (CAST) Investigators. Preliminary report: effect of encainide and flecainide on mortality in a randomized trial of arrhythmia suppression after myocardial infarction. N Engl J Med. 1989;321(6):406-412.
- Barter PJ, Caulfield M, Eriksson M, et al. Effects of torcetrapib in patients at high risk for coronary events. N Engl J Med. 2007;357(21):2109-2122.
- Nissen SE, Wolski K. Effect of rosiglitazone on the risk of myocardial infarction and death from cardiovascular causes. N Engl J Med. 2007;356(24):2457-2471.
- Wyse DG, Waldo AL, DiMarco JP, et al. A comparison of rate control and rhythm control in patients with atrial fibrillation. N Engl J Med. 2002;347(23):1825-1833.
- Athey S, Chetty R, Imbens GW, Kang H. The surrogate index: Combining short-term proxies to estimate long-term treatment effects more rapidly and precisely. Rev Econ Stud. 2025;rdaf087.
- Yuan N, Duffy G, Dhruva SS, et al. Deep learning of electrocardiograms in sinus rhythm from US veterans to predict atrial fibrillation. JAMA Cardiol. 2023;8(12):1131-1139.
【全文结束】

