人工智能、大数据与未来医疗保健AI, Big Data and future healthcare

环球医讯 / AI与医疗健康来源:mcpress.mayoclinic.org美国 - 英文2025-07-08 15:36:25 - 阅读时长7分钟 - 3284字
本文探讨了人工智能和大数据在医疗保健领域的应用,特别是通过心电图检测心脏疾病的方式,并介绍了相关研究案例,展示了这些技术如何提升诊断效率并推动全球医疗进步。
人工智能大数据医疗保健心脏病房颤电子健康记录AI-ECG仪表板患者健康疾病诊断药物安全
人工智能、大数据与未来医疗保健

人工智能(AI)能否拯救生命?虽然它不能直接做到这一点,但近年来的创新已经改善了医务人员用于挽救生命的资料。下面的摘录来自梅奥诊所专家保罗·塞拉托(Paul Cerrato, M.A.)和约翰·D·哈拉姆卡(John D. Halamka, M.D., M.S.)所著的《变革》一书,提供了一个关于AI实际应用的真实例子。这些作者用事实和真实案例清晰地说明了专家们如何使用AI将医疗保健转变为更高效且更具包容性的服务。

彼得·梅尔克林(Peter Maercklein),一位七十多岁的退休金融高管,在人工智能(AI)驱动算法的帮助下发现自己患有房颤(AFib),即不规则的心跳颤动,这可能导致血栓形成。像许多房颤患者一样,彼得并未感到任何症状。他和妻子正在享受退休生活,经常开着房车旅行,并在明尼苏达州东南部度过大部分夏天。2020年,罗切斯特梅奥诊所的研究协调员邀请他参与一项研究。这项现已完成并发表的研究评估了利用正常心律时记录的心电图(ECG)进行AI指导筛查以识别未被发现的房颤的效果。彼得的AI-ECG显示他有81.49%的概率经历房颤,因此他佩戴了一台动态心电图监测仪来记录他的心律变化。几天后,监测仪确认彼得在家中跑步机上行走时确实出现了房颤。随后,他见到了自己的医疗团队,并接受了进一步测试以确认诊断,之后开始服用抗凝药物以降低中风风险。后来,彼得还植入了起搏器以控制心律。

参与研究的其中一位心脏病学家保罗·弗里德曼(Paul Friedman)博士指出,心血管疾病是美国及全球范围内的头号杀手。我们能否在出现改变生命的事件(如心脏病发作、心脏骤停或中风)之前预防疾病?这正是梅奥诊所及其他世界领先的医学中心正在做的事情。梅奥诊所利用AI通过心电图读数来检测和预测心脏病,而心电图既常见又相对便宜,甚至可以通过可穿戴设备(如智能手表)获取。AI能够察觉人眼无法识别的心电图变化,即使在症状出现前也能捕捉到心脏病的电信号。

梅奥诊所创建了一个可以在电子健康记录(EHR)中查看的AI-ECG仪表板,该仪表板显示患者患某些心脏疾病的可能性,例如房颤、低射血分数(弱心泵)、肥厚型心肌病(HCM,左心室增厚)、主动脉瓣狭窄(动脉钙化)以及淀粉样变性(折叠蛋白堆积)。该仪表板为诊断、预后和临床护理提供了多个切入点。医生可以比较患者随时间变化的AI评估结果,快速了解其心脏和循环系统的健康状况。患者甚至可以通过安全的梅奥诊所应用程序直接将Apple Watch心电图发送到他们的电子健康记录中,从而增加另一个监控变化的检查点。这些信息丰富了医生的知识,可用于标记需要进一步测试和潜在治疗的患者。

AI的优势比许多人意识到的更为深远。它正在使创新医疗服务更加民主化。在美国乃至全球范围内,并非每个人都能接触到拥有专业诊断设备的大型医疗中心。一些心脏疾病的症状与其他病症相似,那么我们如何更快、更容易地识别需要治疗的患者呢?AI-ECG算法提供了一种相对廉价的方法来发现疾病并对高风险个体进行分类。这些研究工具目前作为指南在梅奥诊所使用,同时正由监管机构审查以实现更广泛的商业用途。一旦获批,我们预计这些算法将在全球范围内广泛采用,从而提高诊断水平和患者健康。

尽管AI驱动算法的价值显而易见,但往往被忽视的是支持研究人员开发这些数字工具所需的海量患者数据集。没有这个数据库,就几乎不可能进行用来创建算法的临床试验。

大数据的力量

梅奥诊所使用的数据网络包含数千万份电子病历,可用于深入了解特定疾病的成因及其最佳治疗方法。这是近年来医学领域中迅速发展的“大数据”运动的一部分。这种大规模数据的价值通过调查某些处方药可能造成的危害得到了充分证明。通常情况下,此类药物会在几千名受试者的临床试验中进行测试。然而,这种规模的患者群体往往不足以检测出相对罕见的不良反应。

一个展示大数据力量的好例子是由美国食品药品监督管理局(FDA)药物安全办公室科学副主任大卫·J·格雷厄姆(David J. Graham, MD, MPH)及其同事开展的一项研究。他们分析了大约140万名加利福尼亚州凯撒永久医疗集团成员的记录。研究的目的是确定罗非昔布(Vioxx,一种环氧化酶-2选择性非甾体抗炎药)是否会增加急性心肌梗死(一种心脏病发作)和猝死的风险。格雷厄姆及其团队审查了相当于2,302,029人年的随访数据。在这一人群中,他们发现了8,142例严重冠心病(CHD)病例,其中2,210例是致命的。服用任何剂量该药物的患者发生CHD的可能性比对照组高出59%。对于每天服用25毫克或更低剂量的患者,患CHD的几率增加了47%;而对于每日服用高剂量(超过25毫克)的患者,患心脏病的风险则提高了258%。

在FDA数据公布之前,几项较小的早期研究暗示了Vioxx与心脏病之间的关联,但这些发现存在多种缺陷。格雷厄姆及其团队的数据在发表于《柳叶刀》之前的会议上被提出,引起了广泛关注,并导致研究人员与最初不愿公开结果的FDA官员之间的冲突。默克公司于2004年9月30日撤回了Vioxx。据估计,在该药物上市期间,共开具了超过1亿张处方,由于公众接触Vioxx,可能导致了88,000至140,000例额外的严重CHD病例。它的撤市无疑证明了大数据的价值。格雷厄姆的研究只是众多研究中的一个,展示了利用海量数据获得有意义的医疗洞察的好处。

大数据方法在医疗保健中的应用

庞大的数据网络吸引了医疗主管和临床医生的关注。它们是大数据运动和相关专业数据分析的一部分。大数据通常以其体量、速度和多样性区别于“小数据”。所谓的3V反映了可用于分析的数据量巨大,远远超过了传统临床试验和人群研究中获得的数据量。目前正在研究的数据库可能包括拍字节(PB)级别的数据,每个拍字节包含1,024太字节(TB),或者艾字节(EB),每个艾字节包含1,024拍字节。(1太字节包含1,024千兆字节。)这些数据库可能包含数十亿条患者记录,例如电子健康记录(EHR)数据、社交媒体、理赔数据等。这些数据库通常由结构化数据组成——例如患者的国际疾病分类(ICD)代码——以及非结构化数据,例如描述患者体征和症状的叙述。此外,这些数据积累的速度(速度)以及不同类型的数据(多样性),例如来自远程传感器的输入、硬盘和智能手机上的文本数据以及视频、照片和X射线的图像数据,也使大数据区别于更传统的患者信息来源。

所有这些数据都可以存储在不同类型的“存储箱”中,包括关系数据库和数据仓库,并通过分布式计算过程链接这些存储箱进行分析,使用诸如Hadoop这样的工具(发音为huh-DOOP)。数据科学家还使用“语义”、“语法”和“本体论”等术语,这些术语在医学信息学背景下具有特殊含义。

在一个简单的计算机文件夹或目录中,您可能会将信息存储在单独的文件中,如Microsoft Office文本文档或PDF文件,以及TIFF或JPEG格式的图像文件。但是,如果您试图确定这些不同的数据集合之间的关系、相关性或模式,这将会很困难。关系数据库通过创建数据库中数据的结构表示(称为模式)来帮助解决这个问题,使得分析更加容易。数据被分隔在各种表格、字段、行和列中,数据库在众多数据点之间创建关系。然后,可以通过查询数据库提取元素之间的联系,例如列和行之间的联系。一张表可能列出患者的所有人口统计细节,包括年龄、地址、性别和种族,另一张表可能列出他们的家族病史。通过查询数据库,您或许能够确定哪些女性患者有某种特定疾病的病史,因为人口统计与家族病史表之间的联系已内置在工具中。

理解分布式计算的概念是揭开大数据神秘面纱的另一块拼图。简单来说,分布式计算是一种让单个计算机彼此通信并作为一个巨大的“大脑”运作的方式,即使这些机器可能分布在全球各地。互联网是一个分布式计算网络,由节点、路由器等连接而成。Hadoop也是其中之一。目前,数据分析师正在使用它从过于庞大而无法经济地存储在单一位置的数据中获取洞见。


(全文结束)

大健康
大健康