构建混合智能的临床AI新层次Building the next layer of clinical AI with hybrid intelligence

环球医讯 / AI与医疗健康来源:diagnostics.roche.com美国 - 英语2026-02-05 10:33:51 - 阅读时长7分钟 - 3319字
文章深入探讨了临床AI发展的新阶段,提出"混合智能"概念,将经过验证的专用医疗算法与生成式AI相结合,既保持可信赖的临床决策支持,又发挥生成式AI在模拟患者健康轨迹方面的优势。文章分析了当前生成式AI在医疗领域的局限性,强调专用医疗算法仍是目前获得监管批准、保证质量和信任的主要途径,并详细阐述了医疗机构领导者应如何投资AI技术、从真实世界数据中学习以及建立组织准备,以实现AI在医疗领域的有效应用,为医疗专业人员提供两全其美的解决方案,同时确保患者安全和护理质量。
健康临床AI混合智能专用医疗算法生成式AI健康轨迹医疗决策信任监管可解释患者安全个性化护理疾病预测
构建混合智能的临床AI新层次

关键要点

  • 生成式AI正在拓展可能性——但尚不能完全依赖
  • 对临床AI的信任仍始于专用医疗算法
  • 未来在于混合智能——将责任与性能提升相结合

医疗领域热议不断:"难道我们不能让生成式AI包办一切吗?"

在大型语言模型或生成式基础模型能够预测蛋白质结构、起草临床笔记、生成试验摘要并辅助诊断推理的时代,人们很容易认为我们已经走到了专用医疗算法的终点——这些经过预训练和验证、针对特定任务的临床AI模型,默默预测心力衰竭和肾病的疾病进展,或实时标记脓毒症。

尽管它们才刚刚开始进入主流医疗决策,但与生成式AI预期的能力相比,以终点为导向、单一用途的专用医疗算法几乎显得有些过时。

我们正站在临床AI发展的关键十字路口。生成式模型正在重写可能性——但目前,专用医疗算法仍是获得监管测试、保证质量、性能和信任的主要途径。

生成式AI在医疗领域的规模诱惑

2025年发表的两项里程碑式研究既展示了进展的速度,也揭示了其局限性。

Epic Systems和微软研究院发布了CoMET,这是一系列大规模生成式模型,训练数据包括超过3亿患者记录和160亿次医疗接触。CoMET通过模拟"未来健康时间线"来学习预测医疗事件——从诊断到医疗干预。值得注意的是,尽管训练数据规模庞大,但CoMET在某些疾病领域的表现与传统特定任务的专用模型相当甚至更优,而在其他领域则不然。

与此同时,欧洲分子生物学实验室和欧洲生物信息学研究所(EMBL-EBI)的研究人员在《自然》杂志上发表了经过修改的生成式预训练Transformer(GPT-2衍生)大型语言模型Delphi-2M的结果。该模型使用来自40万英国生物银行参与者的数据进行训练,并使用来自丹麦193万人的数据进行外部验证。Delphi-2M模拟人类疾病的自然史,同时预测1000多种疾病(确切地说是1,258种不同状态)的发病率,覆盖完整的ICD-10列表。Delphi-2M不仅预测单一结果,还预测多种疾病及其出现时间,使得模拟未来健康轨迹成为可能,提前20年预测疾病发作,并考虑多种疾病共存的情况。

然而,这两项研究也披露了当前的局限性:生成式模型尚未准备好用于临床一线,更不用说监管框架缺失的问题。Delphi-2M报告了选择偏差和永生偏差、数据源缺失以及预测性能方面的局限性。Delphi-2MCoMET在不同疾病上的准确性水平不一致,对于后者,效能取决于模型规模。

在糖尿病的诊断和风险预测方面,专用医疗算法的表现仍优于Delphi-2M。对于CoMET来说,在考虑特定慢性疾病结果时也是如此,例如高脂血症患者1-3年内心力衰竭、中风、心脏病发作或动脉粥样硬化性心血管疾病的风险。

为何对临床AI的信任仍始于专用医疗算法

医疗领域采用AI需要建立在高度准确性和可重复性基础上的信任——这正是专用医疗算法仍能提供的关键要素。具体来说:

  • 针对特定临床终点和可测量结果经过验证
  • 可解释、可审计且获监管机构批准
  • 融入工作流程,确保每位患者自动、公平地受益

专用算法具有明确的输入和输出参数,使临床医生能够理解推断的基础。而另一方面,在原生医疗数据上训练的生成式AI模型则依赖于从大规模纵向数据中学习健康语法和上下文逻辑(如CoMET),通过聚合多个独特、概率性的模拟来实现可重复性。

生成式AI模型的未来价值在于其能够模拟患者健康旅程中的潜在路径,提供关于接下来可能发生什么的量化、数据驱动的洞察。换句话说,是主动而非被动的护理规划。

未来AI临床决策支持工具的提案:混合智能

考虑到这两种方法对临床AI的益处,未来临床医生将同时接触专用医疗算法和生成式基础模型。这种"混合智能"将当今经过验证的专用医疗算法与在后台学习的生成式AI相结合——完善对健康轨迹的理解并发现新模式。

在混合框架中,一线系统仍由预测、解释和决策的终点导向专用医疗算法驱动。在后端,生成式模型持续从真实世界数据中学习,识别细微的人群模式并指导下一代临床工具。

随着时间推移,专用医疗算法可能会受益于生成式AI考虑更广泛临床背景的能力,推动护理个性化。同时,微调生成式模型可以提高特定任务的预测性能。这种"混合架构"是双赢的,使医生能够从两种模型的优势中受益。例如,混合基础模型可以在必要或适当时触发专用算法。

通过将医疗特定基础模型与可信的临床知识源(如知识图谱)连接,和/或应用检索增强生成(RAG)来改进它们。这导致基于事实、通过更高质量推理加强的更可靠、一致的输出。减轻对幻觉的担忧并创建验证和审计基础模型性能的机制,对于在医疗系统中建立信任和扩大采用至关重要。"混合智能"模型的强化机制支持了责任与性能的必要结合。

医疗领域AI的采用:为何这对医疗领导者至关重要

对于医疗企业管理领导层而言,医疗领域采用AI既需要远见,也需要与AI准备相关的持续改进。将在下一个十年领先的医疗系统是那些以AI优先方式重新设计基础设施的系统——既支持成熟AI应用的快速采用,又为创新提供安全环境。因此,当涉及到AI支持的临床决策支持时,医疗系统应考虑:

  • 投资经过验证和监管批准的专用医疗算法: 这些成熟技术如今提供临床性能,保障患者安全,并可能继续成为高性能企业级临床AI解决方案的重要组成部分。
  • 从真实世界数据中学习,与临床事实对标,减轻偏差: 创建沙盒环境,在安全的、非决策环境中运行新的医疗算法、经过RAG增强的生成式模型和/或知识图谱。
  • 建立强大的素养和组织准备: 建立将AI视为持续学习生态系统的治理框架,其中责任、验证和公平是不可或缺的部分。

医疗算法与临床AI:前进之路

我们正进入医疗算法和临床AI的下一个时代——一个专注于在个体和人群层面上理解疾病语言和患者旅程的时代。基础模型通过对纵向健康记录和其他患者健康数据源进行标记化,正帮助我们以新颖方式识别疾病进展模式。就像大型语言模型通过阅读数十亿句子学习语法一样,基于医疗数据训练的基础模型正在学习塑造疾病发作、进展以及这些结构在人群中相互作用的潜在结构。这类疾病模型使我们向实现所谓的"数字孪生"迈进了一大步:一个患者的虚拟表示,用于模拟健康状况如何随时间演变以及不同干预措施可能如何影响结果。

基础模型为医学科学带来的突破无疑令人兴奋。然而,它们不必以牺牲能够帮助患者的当前安全有效技术为代价。当我们大胆迈向临床AI的未来时,用于数字解决方案临床实施的混合智能模型将使医生能够为患者带来两全其美的效果。

贡献者

奥坎·埃金奇,医学博士,工商管理硕士,高级副总裁,罗氏信息解决方案全球数字技术负责人兼首席医疗信息官

奥坎·埃金奇是罗氏信息解决方案(RIS)的数字技术负责人兼首席医疗信息官,他专注于设计和验证综合数字健康解决方案,赋能医疗专业人员和患者做出更好的护理决策并推进个性化医疗。他于2018年加入罗氏,曾担任数字健康业务的首席医疗官和市场营销与创新高级副总裁。在此之前,奥坎在西门子医疗担任过多个职位,包括首席医疗官和医疗咨询负责人。凭借在成像、诊断和数字健康方面的丰富经验,他为医疗机构和政府提供了关于数字化转型、个性化医疗和人工智能战略的建议。奥坎是经过培训的心脏病专家(专长于心血管MRI和CT),也是爱尔兰都柏林大学学院的医学兼职教授。

参考文献

  1. Pantanowitz, L. 等 (2025). 《医学中的非生成式人工智能:监督和无监督机器学习的进展与应用》。来源:
  2. Shanmugam, D. 等 (2025). 《医学中的生成式人工智能》。来源:
  3. Waxler, S. 等 (2025). 《生成式医疗事件模型随规模提升》。来源:
  4. Shmatko, A. 等 (2025). 《使用生成式Transformer学习人类疾病的自然史》。来源: (访问日期:2025年10月14日)
  5. Henriksson, A. 等 (2023). 《用于预测COVID-19结果的临床语言模型多模态微调》。来源:

【全文结束】