医疗保健中的人工智能:应用、挑战与未来方向——基于国际多学科专业知识的综述Frontiers | Artificial intelligence in healthcare: applications, challenges, and future directions. A narrative review informed by international, multidisciplinary expertise

环球医讯 / AI与医疗健康来源:www.frontiersin.org英国 - 英语2025-11-15 01:40:29 - 阅读时长35分钟 - 17055字
本文是一项基于国际多学科专业知识的叙述性综述,系统评估了人工智能在医疗保健领域的应用现状、挑战与未来发展方向。文章详细阐述了人工智能在诊断、手术导航、风险预测和个性化医疗等方面的临床应用,探讨了其在药物研发、基因组学和临床试验优化等研究领域的潜力,同时分析了算法偏见、可解释性、法律框架和全球获取不平等等关键挑战。研究强调了在监管框架下由临床医生主导设计、关注全球公平性的重要性,并提出未来工作应聚焦于稳健验证、负责任实施和数字医学教育扩展,以确保人工智能能够安全、公平地增强医疗保健服务与研究。
人工智能机器学习深度学习生成式人工智能大型语言模型医疗保健数字健康外科相关健康专业个性化医疗风险预测伦理偏见隐私
医疗保健中的人工智能:应用、挑战与未来方向——基于国际多学科专业知识的综述

摘要

目标: 本叙述性综述评估了人工智能在医疗保健中的作用,总结了其历史演变、在医疗和外科专业领域的当前应用,以及对相关健康专业和生物医学研究的影响。

方法: 我们在Ovid MEDLINE(2018-2025年)中进行了结构化文献检索,使用与人工智能、机器学习、深度学习、大型语言模型、生成式人工智能和医疗保健应用相关的术语。优先考虑提供新颖见解、多学科视角和覆盖代表性不足领域的同行评审文章。

主要发现: 人工智能越来越多地应用于诊断、手术导航、风险预测和个性化医疗。它在相关健康专业、药物发现、基因组学和临床试验优化方面也显示出前景。然而,由于偏见、可解释性、法律框架和全球获取不均等挑战,其应用仍然有限。

贡献: 本综述强调了生成式人工智能和相关健康专业等未被充分探索的领域,提供了综合的多学科视角。

结论: 通过谨慎监管、临床医生主导的设计和全球公平性考虑,人工智能可以增强医疗保健服务和研究。未来工作必须聚焦于稳健验证、负责任实施和数字医学教育的扩展。

1 引言

人工智能(AI)是一个快速发展的科学领域,旨在创造能够执行通常需要人类智能的任务的机器技术。由于其在执行通常需要人类认知的任务方面具有显著能力,人工智能的可见度日益提高,这得益于深度学习模型的应用。从创意艺术到其他领域,人工智能的使用已经得到注意。与医疗保健系统的复杂融合前景广阔,但也带来了自身的挑战,在改善患者预后的同时也引发了许多伦理和监管挑战。

医疗保健正经历转型性变革,原因是需求增长、医疗成本上升和日益紧张的系统。特别是最近的新冠疫情似乎加剧了现有的健康不平等,现在似乎是实施新兴技术以增强临床实践的最佳时机。从药物发现和医学诊断中的潜在时间和成本节约,到基因组测序和疾病易感性的革命性见解,人工智能最近已进入医疗保健的各个领域,从预防医学和公共卫生到急性医院医学和外科手术。自机器学习和深度学习的发展以来,人工智能在医疗保健中的应用已从基于算法的医学模式扩展到更加个性化的方法。

最近,改进的人工智能系统有可能改善甚至取代医生的当前功能。然而,有几个障碍限制了其普遍采用,包括人工智能算法缺乏透明度,这与临床医学依赖于决策透明度的医学伦理相悖,而当前临床实践使用的是循证医学。

本综述的动机源于人工智能在非医疗部门的快速采用速度与医疗保健相比,尽管医疗保健是创新需求最大的领域之一。虽然先前的综述已涉及放射学或外科等特定领域的AI,但很少有综述全面检查其跨学科影响,包括相关健康专业和生成式人工智能等代表性不足的领域。本文旨在提供医学、外科、相关健康和生物医学研究中人工智能应用的多学科综合。此外,我们还旨在批判性地评估实施的局限性和监管挑战。最后,我们旨在提出能够指导安全、公平和负责任的AI集成的未来研究方向。本综述首先介绍人工智能的历史和演变,然后介绍其临床和研究应用、局限性,最后介绍未来融入医疗保健系统的方向。

本文旨在讨论人工智能的历史及其在临床实践中的日益突出作用,特别是在近期历史中。它讨论了人工智能在包括医疗和外科专业以及健康预防和健康促进在内的医疗保健各个领域的角色。本文还解决了人工智能在临床实践中的当前限制并探索可能的解决方案。此外,本综述考虑了更广泛医疗保健系统中更流畅实施的潜在未来应用和策略。

此外,本综述考察了相关医疗保健专业和生成式人工智能(GenAI)等代表性不足的领域。与传统关注以医生为主导的应用不同,本综述探讨了人工智能在物理治疗、言语治疗、营养和心理健康中的作用。我们还旨在探索大型语言模型(LLMs)在自动化和改进文档、沟通和决策中的作用。这为人工智能在医疗保健中可能的未来整合提供了现实的监督。

我们在Ovidmedline上进行了文献检索,截至2025年7月。搜索词包括"人工智能"、"机器学习"、"深度学习"、"大型语言模型"、"生成式人工智能"、"数字健康"和"医疗保健"的组合,以及"外科"、"放射学"、"心理健康"、"相关健康专业"、"伦理"、"监管"和"临床应用"等专业术语。使用布尔运算符(AND,OR)来优化结果。优先考虑2018年至2025年间发表的同行评审文章,这些文章提供了新颖见解、多学科视角和对相关医疗保健和人工智能监管等代表性不足领域的覆盖。

2 了解人工智能及其历史

自1951年克里斯托弗·斯特雷奇开发第一个AI程序以来,人工智能已经显著演变。最初主要是学术研究课题,在接下来的二十年中,工程领域取得了重大创新进展,如装配线上的电子臂和能够遵循基本指令的第一个简单机器人。尽管有此进展,医学在此期间采用该技术的速度较慢。然而,此期间医学取得了重大进展,将为未来医学中人工智能奠定基础;这些包括医疗记录系统和临床信息学数据库的开发。国家医学图书馆在此期间创建了基于网络的搜索引擎PubMed,这是一个基本的数字资源,促进了我们所知生物医学的加速发展(图1)。

接下来的几十年见证了向机器学习的转变,这是人工智能的一个子领域,专注于模式识别和分析,旨在通过数据集经验来改进机器。随后,开发了自然语言处理,这是另一个涉及计算机从人类语言中提取数据并基于该信息做出决策的人工智能子领域。

从20世纪90年代末和2000年代开始,机器学习已发展为深度学习,这是一种多层神经网络系统,使机器能够自主学习和做决策,其作用类似于人脑。2000年代开始出现人工智能的开创性进展。2007年,国际商业机器公司(IBM)开发了Watson,这是一个依赖于称为DeepQA的技术的问答系统,该技术使用自然语言处理来分析数据并生成答案。该系统易于维护,成本效益更高。

利用存储在电子医疗记录和其他可用电子资源中的信息,DeepQA技术开启了基于循证医学的临床决策的新可能性。Bakkar等人通过在肌萎缩侧索硬化症(ALS)中使用该技术识别改变的RNA结合蛋白,恰好证明了这一点。

在此之前,由于计算能力和资金的先前限制,此类人工智能应用并不存在。然而,在最近由于计算能力的增强、数据量的增加和进一步的资金支持,人们对医学中人工智能的使用持更加乐观的态度。

从诊断到医疗保健的运营管理,这些最近的出现使利益相关者更加投资于其在临床医学及更广泛领域的使用。总体而言,普通民众对此表示极大热情,因为它通过启用"4P"医学模型(预测性、预防性、个性化和参与性),以前所未有的方式赋予患者更多自主权。

本文现在将考虑人工智能以有效方式被利用且患者预后更好的医学特定领域。

3 人工智能在现代临床实践中的当前应用

3.1 人工智能在外科专业中的应用

外科医生通常需要在时间压力和诊断不确定性的约束下做出复杂决策,这对患者预后可能产生重大影响(图2;表1)。

3.1.1 整形和重建外科

人工智能在术前规划、风险评估、手术模拟中的结果预测方面已显示出潜力。然而,在整形外科领域操作时,AI辅助机器人能够提高精度和技术能力,特别是在显微外科领域。人工智能的图像处理能力用于客观评估术后对称性、体积和美学结果。此外,AI驱动的诊断系统正在帮助早期识别并发症,如皮瓣缺血,通常比传统临床方法更早发现这些问题。

3.1.2 普通外科

普通外科领域包括手部灵巧性至关重要的高风险手术。人工智能允许通过实时识别解剖结构并在各种复杂手术中为外科医生提供指导来降低术中风险,从而减少潜在错误。Yagi等人进行的系统综述探讨了实时器械跟踪在个性化外科培训中的作用,提高了技术熟练度和临床结果。

术前决策也通过人工智能增强现有风险预测模型的能力得到了显著改进。有几种已建立的评分系统,如APACHE III和POSSUM,它们仍然是评估手术发病率和死亡率的基本工具。然而,该领域的许多条件已指出,这些系统没有考虑个体化风险。机器学习可以改进这些模型,提高其预测能力并允许更个体化的风险评估。

3.1.3 胃肠道外科

人工智能在胃肠道(GI)外科领域提供了一些最具影响力的创新,特别是在内镜成像领域。内镜超声(EUS)是区分胰腺癌和慢性胰腺炎的关键方式,其诊断精度已通过基于AI的模型显著提高。

在下消化道内镜检查中,AI辅助结肠镜检查已显示出明确的临床益处。计算机辅助检测(CADe)系统提高了腺瘤检测率,并促进了良性与恶性病变的区分。一项随机对照试验进一步证实,与传统方法相比,AI引导的结肠镜检查显著提高了腺瘤检测率。同样,应用于上消化道内镜检查的AI工具在识别肿瘤性巴雷特食管方面达到了89%的准确率(90%敏感性和88%特异性),提高了早期检测和干预。

3.1.4 肿瘤外科

在肿瘤外科中,人工智能能够通过整合多个与肿瘤相关和患者相关的变量来预测癌症患者的预后。这些模型对患者生存率有较强的预测能力,并能够识别对结果有影响的变量。这是通过整合临床、影像和病史病理数据实现的,使治疗策略更加个性化,从而在精准肿瘤学实践中取得了实质性进展。

3.1.5 外科教育和技能评估

人工智能正在重新定义所有学科的外科教育。通过计算机视觉,AI可以实时跟踪外科医生的手部和器械运动,提供客观且可扩展的性能指标和反馈。此类技术有可能在全球范围内标准化培训并提高外科能力标准。机器学习及其子类别,包括监督学习、无监督学习、强化学习和深度学习,以及各种传感器,包括光学、惯性、电磁、超声和混合传感器,提供独特优势,可应用于各种外科培训和患者护理环境。

将人工智能整合到外科实践中,在手术过程的各个阶段都提供了变革潜力,从术前风险评估到术中指导和术后结果。随着技术的成熟,将其谨慎整合到临床工作流程中将至关重要。持续研究、严格的临床试验和强有力的监管监督对于最大化其益处同时确保安全和合乎伦理的应用至关重要,这将在本综述中进一步讨论。

3.2 人工智能在医学专业中的应用

人工智能技术已整合到众多医学专业中,每个专业都受益于提高的诊断准确性、预测建模和个性化治疗规划。以下部分按生理系统或临床领域对当前应用进行分类。

3.2.1 心血管系统

人工智能在心血管诊断和风险预测中发挥了重要作用。心房颤动(AF)检测是最早和最具影响力的應用之一。REHEARSE-AF试验表明,使用Kardia(一种AI支持的移动心电图设备)检测AF比常规护理更准确。尽管可穿戴心电图设备因高假阳性率而受到批评,但它们仍然是大规模筛查的宝贵工具。此外,应用于电子健康记录(EHR)的人工智能在预测急性冠脉综合征和心力衰竭等心血管疾病方面已优于传统风险计算器。

3.2.2 神经系统

在神经学领域,AI驱动的可穿戴传感器已被证明在监测和评估与帕金森病、亨廷顿病和多发性硬化症相关的运动症状方面很有用。这些设备以高灵敏度量化步态异常、震颤和姿势,支持诊断和疾病进展跟踪。人工智能在癫痫发作监测方面也显示出前景。由AI算法支持的持续移动系统可以比传统方法更可靠地检测癫痫发作事件。

3.2.3 胃肠道系统(内镜与成像)

人工智能显著提高了诊断胃肠道病理的精确性。例如,使用人工智能检测结肠息肉并区分其是否为良性和恶性比普通临床医生更准确。一项随机对照试验证明,使用AI与标准结肠镜检查相比,腺瘤检测率有显著提高。在上消化道诊断中,人工智能已被用于区分肿瘤性巴雷特食管与非发育不良巴雷特食管,准确率为89%(90%敏感性,88%特异性)。

3.2.4 肿瘤学

精准医学是一种首选的临床方法,旨在根据患者个体的肿瘤基因组特征定制治疗。想象一下计算方法能够根据靶细胞的基因组特征预测药物反应。Huang等人的研究揭示,人工智能模型能够以80%以上的准确率预测患者反应。高阳性预测值表明,人工智能可用于识别在标准护理一线治疗失败后有前景的二线治疗选择。

3.2.5 心理健康

在心理健康领域,重要的是识别组织化的治疗计划并监测治疗以及心理健康专家的指导。AI辅助平台支持早期检测、风险分层和治疗规划。AI增强的在线认知行为疗法(CBT)工具在治疗常见心理健康障碍方面已显示出临床有效性。此外,AI模型可以分析行为模式和语言线索,帮助临床医生诊断抑郁症、焦虑症和精神分裂症。

3.2.6 放射学和医学成像

医学成像对于提供诊断信息不可或缺,但严重依赖临床解释,并面临日益增加的资源挑战。通过人工智能从医学成像进行自动诊断是未来的发展方向。许多研究显示,深度学习模型已经匹配并超过了人类诊断性能,令临床医生和科学家感到极大振奋。尽管有这些前景,2019年的一项荟萃分析显示,99%的这些研究缺乏严谨的方法学,限制了其临床可靠性。这些发现强调了在常规采用前进行高质量临床试验以验证放射学中人工智能应用的必要性。

3.2.7 病理学

人工智能正被用于癌症诊断,提供更快、更高质量和更准确的诊断。借助先进的人工智能,诊断技术的算法正被用来协助、增强和赋能计算病理学。全切片成像扫描仪现在为整个玻璃载玻片提供高分辨率图像,将其与数字病理工具结合,整合包括解剖、临床和分子病理学在内的所有病理报告方面。

3.2.8 人工智能在相关医疗保健专业中的应用

必须提到的是,人工智能正越来越多地被各种相关健康专业人员使用,包括物理治疗师、营养师、言语和语言治疗师以及心理健康提供者。例如,物理治疗师正在利用可穿戴AI设备支持远程康复和步态分析。营养师也正在根据个人基因和生活方式创建个性化营养计划。此外,言语和语言治疗师正在使用人工智能检测语言障碍和检测进展。

3.2.9 生成式人工智能和大型语言模型(LLMs)在临床实践中的应用

生成式人工智能和大型语言模型,包括ChatGPT、Med-PaLM和BioGPT,正越来越多地被用于医疗保健系统。它们被用于总结临床笔记、生成出院摘要、转录口述内容,甚至协助决策。Danqing Hu等人最近发表的一项研究表明,大型语言模型解释放射学扫描的能力,发现它们产生的印象具有高度的完整性和正确性,但在简洁性和真实性方面有所欠缺,表明传统医生目前还不能被取代。

3.3 人工智能在生物医学研究和创新中的应用

由于资源有限,公共卫生和人群健康战略依赖前瞻性分析数据来有效指导健康举措。这可能在使用预测分析成功识别有更高风险发展为慢性健康状况(如2型糖尿病等内分泌疾病或心力衰竭等心脏疾病)的患者方面至关重要。人工智能技术可用于开发有效算法,更精确地分析数据并开发更稳健的预测模型;这可以降低成本并改善患者预后。通过分析患者病史和生活方式因素等数据,预测模型可以帮助对被认为有较高风险的患者实施有针对性的干预。

3.4 人工智能在生物医学研究中的应用

在医疗保健中,人工智能最具变革性的作用之一是其在生物医学研究中的应用。作为创新的推动者,人工智能正在简化和彻底改革研究管道的多个阶段,从发现到临床转化。

3.4.1 药物发现与再利用

一个里程碑式的例子是DeepMind的AlphaFold,它在蛋白质结构预测方面取得了重大进展,这是药物开发中靶点识别的基本组成部分。人工智能和深度学习网络已证明能够识别不同的抗菌分子结构,从而扩展抗生素武器库。机器学习模型现在被用于设计新分子、预测药物-靶点相互作用以及在硅中评估毒性和药代动力学,减少了早期药物发现相关的时间和成本。

3.4.2 临床试验优化

人工智能通过支持患者招募、通过表型匹配和分层以及预测建模来提高临床试验的效率和成功率。可变设备和移动应用程序也被用于监测依从性。大型语言模型还允许搜索非结构化临床数据,提高试验的包容性和准确性。预测建模使适应性试验设计成为可能,允许根据中期数据进行动态修改,从而提高试验效率并降低运营成本。

3.4.3 基因组学和精准医学

人工智能,特别是深度学习,是分析大规模基因组数据的核心。它促进了致病变异的识别,使基于分子特征的患者分层成为可能,并为个性化治疗策略提供信息。这些进展对精准医学计划的发展至关重要。

3.4.4 科学文献中的自然语言处理

自然语言处理(NLP)工具使AI系统能够快速分析和合成来自庞大科学文献库的发现,通过识别和总结关键发现。这些系统可以加速系统综述和荟萃分析,使临床医生和非临床医生能够跟上最新文献。这增强了假设生成,加速了系统综述,并通过提供对新兴研究趋势的实时洞察来支持循证临床决策。

3.4.5 促进研究中的公平性

最近的努力集中在利用AI减少生物医学研究中的偏见并提高包容性。正在开发AI工具以识别和纠正临床数据集中的代表性不足,从而改善不同人群研究结果的普遍性和公平性。机器学习模型通常从历史上收集的数据中学习。因此,已经经历过过去人类偏见的数据容易导致错误预测或资源扣留。这使我们得出结论,应该积极使用机器学习系统来推进公平性。这可以通过将分配正义纳入模型设计和部署来实现。

4 人工智能在医疗保健中的局限性

人工智能已证明其能力能够增强许多不同领域的医疗实践。尽管如此,它遇到了某些阻力,特别是来自医疗保健专业人员而非患者。

首先,需要考虑AI适用的医疗法律框架。从伦理角度看,需要一定程度的责任,特别是对于所犯的错误。现有法规已经使验证医疗错误发生时的明确责任线变得困难,而在AI系统下情况变得更加不明确。这当然是一个需要与法律当局、医疗保健人员和医疗保健中其他关键利益相关者密切合作的关键领域,以获得比目前更清晰的认识。

医疗保健人员不仅应该密切参与医疗保健中进一步AI服务的开发,还应该领导它。这将确保可以从算法生成的任何数据进行审查,从而允许更公平的责任程度。此外,让临床医生更多地参与AI应用的测试和设计可以帮助建立对所用系统的信任感。临床医生历史上对外科新技术的采用速度较慢,依赖于经过验证的临床护理方法,然而,通过早期更多参与,这有望减少临床医生在日常护理中使用新系统的障碍。

人工智能在医疗保健中快速引入的另一个普遍论点是一般缺乏数字医学领域的培训和教育。人们担心由于该领域教育不足,对这一转变普遍准备不足。也有人担心AI会取代临床医生并"接管";然而,最近的观点是,AI将在未来补充和贡献临床医生的能力和智慧。

其他挑战包括依赖机构特定数据,这些数据可能无法很好地跨医疗保健系统转换;随着实践模式变化,模型准确性随时间下降的风险;将AI与现有电子记录链接的困难;以及如果系统整合不佳,可能会增加而非减少工作量。这些问题突显了在广泛使用前进行仔细验证的必要性。

4.1 未来潜力

最近,特别是在近期,向数字医学和整合到医疗保健中的AI技术已经发生了明显的地震性转变。现在似乎是指导未来系统自动化并总体上改善医疗保健交付的绝佳机会。

我们期望人工智能支持公共卫生,分析患者数据和环境因素,预测潜在疾病。我们还期望AI能够提高分析X光、MRI和CT扫描等医学图像的能力,提高这些测试的敏感性和特异性。其他领域包括个性化医学,即根据您的基因构成接收治疗。人工智能还将应用于行政任务,以简化计费、预约安排和回答患者查询。我们还将能够通过可穿戴设备收集患者数据,并依靠远程医疗平台进行远程咨询。

还需要考虑将AI广泛整合到医疗保健中的伦理含义。从收入角度看,它是现代最有前途的市场之一,2019年市场价值达到千亿美元。越来越多的收入来自医疗设备销售,例如心电图监测器。因此,政府和保险公司正在与这些公司达成交易。医疗监控的伦理含义经常被讨论,潜在的隐私侵犯和持续监控可能增加对更弱势患者或慢性病更多患者的污名化风险。数据保护和所有权是应该强烈考虑以减轻这些风险的明确概念。

几所不同的大学已经创建了新的医学课程,开始解决教育未来医学领导者了解与AI系统面临的挑战的需求。医疗保健机构和整个社会都可以从这些具有更广泛技能的临床医生中受益匪浅,他们不仅可以作为临床交付中AI系统的安全工具,还可以推动该领域的进一步未来研究。

通过使用AI,医疗保健具有巨大的进一步成本效益潜力。尽管目前关于医疗保健中AI使用的成本效益报告相对有限,但有特定例子已经证明了成功的成本效益。

使用AI进行个性化医学并开发预测算法,通过评估患者的遗传和环境因素来预测每位患者对医疗或外科治疗的反应,可以是优化治疗结果的有效策略。

AI可以在药物开发和制造中发挥基础性作用;通过剂量优化和识别不良药物反应,可以增强治疗结果和患者安全。通过利用AI算法,为每个人量身定制的药物剂量优化过程不仅会提高患者安全,还会提高医疗保健提供者的效率和成本节约目标。新药的开发及其进入市场的速度已通过AI的使用而加快。

此外,AI使用的最大潜力之一是在机器人技术方面,使用不同类型机器人,如移动自主和教育机器人,在医疗保健中使用。机器人的更广泛使用可以进一步提高成本效益。手术机器人正变得越来越常用,因此,未来常见的小手术可能会由机器人系统主导。

未来方向包括:(1)可解释AI以提高信任;(2)联邦学习以在跨机构训练时保护隐私;(3)与机器人的更广泛整合;(4)为低资源环境量身定制的AI;以及(5)绿色AI以减少环境影响。这些途径需要国际合作和强有力的政策。

4.2 确保负责任的AI:数据完整性、隐私和偏见缓解

将AI整合到医疗保健中需要可靠、安全和透明的系统,这些系统基于强大的伦理原则和价值观。这一要求是AI在医疗保健中的采用落后于技术进步的关键原因。作为高风险领域,医疗保健涉及敏感和复杂的数据,包括电子健康记录、医学成像数据库、可穿戴设备输出和公共卫生数据集,这些都需要谨慎处理和监管。

鉴于个人医疗信息是最私密和法律保护最严密的数据形式之一,人们严重关注如何访问、控制或使用这些信息,特别是用于训练AI系统,直到真正自主的自训练AI模型被开发出来。一个关键要求是数据的强有力匿名化,这涉及删除所有可识别信息,包括个人详细信息和患者记录编号。

在欧洲联盟,此类做法必须遵守《通用数据保护条例》(GDPR),该条例要求对这种类型敏感数据的处理具有透明度、知情同意和明确的法律依据。

根据英国信息专员办公室(ICO)的说法,区分AI的开发和部署阶段至关重要。这些阶段代表不同的目的,并受不同的法律考虑约束。例如,为一般任务训练的AI系统(如面部识别)可能随后被部署在不同的环境中,包括犯罪预防、身份验证或社交媒体标记。这些应用中的每一个都涉及单独的法律框架,必须独立评估其合规性。

重要的是,虽然AI模型的训练阶段可能不会直接影响个人,但其部署阶段通常会。一旦部署,AI系统可以自动做出对个人有重大影响的决策,例如确定服务资格或影响法律结果。因此,GDPR和其他法律在部署阶段适用,特别是当涉及自动决策或画像时。

文献中一个关键但未被充分探索的方面是人工智能(AI)中的算法偏见。AI系统根据其训练数据的行为。如果AI在反映现有社会不平等的数据集上进行训练,它可能会延续甚至放大这些偏见。例如,在主要以白人男性患者数据训练的AI模型,当应用于女性或黑人患者时,可能会产生不准确或不公平的结果。解决此问题需要有意使训练数据集多样化,定期进行偏见审计,以及在将AI系统转移到不同人群或机构时调整模型。一种方法是使用来自新目标人群的代表性数据对模型进行微调,或允许AI跨多个异构数据集进行训练。然而,这引发了关于数据隐私、治理和患者同意的担忧,特别是在涉及多个健康记录时。此外,许多AI系统作为"黑箱"运行,提供输出但没有关于决策如何做出的透明度。这导致了对可解释AI(XAI)的兴趣日益增长,XAI旨在增强模型可解释性,并确保临床医生和患者可以理解算法决策背后的原理。XAI旨在弥合决策与人类对输出解释之间的差距。

世界卫生组织的指南代表了全球伦理和数字技术专家的协作工作,为公共健康中人工智能的负责任使用提供了一个框架。它支持政府履行基本公共卫生职能,包括疾病监测,同时将伦理、人权和公平置于AI系统设计、部署和实施的核心。

欧盟人工智能法案根据风险对AI系统进行分类,并要求透明度、质量保证和可追溯性,特别是在医疗保健等高风险环境中应用AI时。医疗器械法规通过进一步要求符合性评估和CE标志在使用前识别AI使用的风险。在美国,应用AI系统时的保密性和泄露保护由《健康保险可携带性和责任法案》(HIPAA)管辖。这些框架不是为了阻止所谓的"技术进步",而是为了确保责任。

5 结论

本综述评估了人工智能在医疗保健中的使用,重点是代表性不足的领域。通过整合生成式AI和相关健康应用,我们强调了其在不断发展的医疗保健格局中日益扩大的作用。与引入临床实践的任何新工具一样,人们仍然担心初始证据基础有限。尽管取得了多次成功,但对AI益处的抵制和缺乏信任仍然存在。然而,它在其他部门的快速采用展示了这项技术的变革潜力,其发展速度令人瞩目。在后新冠疫情时代,医疗保健面临日益增长的需求和有限的资源,现在是整合AI以加强服务交付的绝佳时机。尽管叙述性综述方法引入了选择偏见和可重复性降低的可能性,但作者的多学科专业知识确保了平衡和全面的综合。

参考文献

  1. Beam AL, Drazen JM, Kohane IS, Leong T-Y, Manrai AK, Rubin EJ. 医学中的人工智能。《新英格兰医学杂志》。(2023) 388(13):1220–1.
  2. Khan B, Fatima H, Qureshi A, Kumar S, Hanan A, Hussain J, et al. 人工智能在医疗保健部门的缺点及其潜在解决方案。《生物医学材料与设备》。(2023) 1(2):731–8.
  3. Krouse HJ. 新冠疫情与日益扩大的健康不平等差距。《耳鼻喉头颈外科》。(2020) 163(1):65–6.
  4. Chan HCS, Shan H, Dahoun T, Vogel H, Yuan S. 通过人工智能推进药物发现。《药理学科学趋势》。(2019) 40(8):592–604.
  5. Kacew AJ, Strohbehn GW, Saulsberry L, Laiteerapong N, Cipriani NA, Kather JN, et al. 人工智能可以在保持结直肠癌基因分型准确性的同时降低成本。《前沿肿瘤学》。(2021) 11:630953.
  6. Kaul V, Enslin S, Gross SA. 医学中人工智能的历史。《胃肠病学内窥镜》。(2020) 92(4):807–12.
  7. Reddy S, Fox J, Purohit MP. 人工智能支持的医疗保健交付。《皇家医学会杂志》。(2018) 112(1):22–8.
  8. Kulikowski CA. 人工智能在医学(AIM)的开端:计算人工辅助科学探究和临床艺术——对当前AIM挑战的反思。《医学信息学年鉴》。(2019) 28(01):249–56.
  9. Alowais SA, Alghamdi SS, Alsuhebany N, Alqahtani T, Alshaya AI, Almohareb SN, et al. 彻底改变医疗保健:人工智能在临床实践中的作用。《BMC医学教育》。(2023) 23(1).
  10. Ferrucci D, Levas A, Bagchi S, Gondek D, Mueller ET. Watson:超越Jeopardy!。《人工智能》。(2013) 199–200:93–105.
  11. Mintz Y, Brodie R. 医学中人工智能导论。《微创治疗及相关技术》。(2019) 28(2):73–81.
  12. Bakkar N, Kovalik T, Lorenzini I, Spangler S, Lacoste A, Sponaugle K, et al. 神经退行性疾病研究中的人工智能:使用IBM Watson识别肌萎缩侧索硬化症中改变的RNA结合蛋白。《神经病理学学报》。(2017) 135(2):227–47.
  13. Orth M, Averina M, Chatzipanagiotou S, Faure G, Haushofer A, Kusec V, et al. 观点:在新兴技术、个性化医学和患者自主权("4P医学")背景下重新定义医生在实验室医学中的作用。《临床病理学杂志》。(2017) 72(3):191–7.
  14. Barone M, De Bernardis R, Persichetti P. 整形外科中的人工智能:应用、展望和心理影响分析。《美学整形外科》。(2024) 49(5):1637–9.
  15. Madani A, Namazi B, Altieri MS, Hashimoto DA, Rivera AM, Pucher PH, et al. 人工智能用于术中指导。《外科年鉴》。(2020) 276(2):363–9.
  16. Yangi K, On TJ, Xu Y, Gholami AS, Hong J, Reed AG, et al. 通过手部和器械跟踪将人工智能整合到外科手术中:系统文献综述。《前沿外科》。(2025) 12:1528362.
  17. Knaus WA, Wagner DP, Draper EA, Zimmerman JE, Bergner M, Bastos PG, et al. Apache III预后系统。《胸部》。(1991) 100(6):1619–36.
  18. Copeland GP, Jones D, Walters M. Possum:外科审计评分系统。《英国外科杂志》。(1991) 78(3):355–60.
  19. Guni A, Varma P, Zhang J, Fehervari M, Ashrafian H. 外科中的人工智能:未来就在现在。《欧洲外科研究》。(2024) 65(1):22–39.
  20. Sato F, Shimada Y, Selaru FM, Shibata D, Maeda M, Watanabe G, et al. 使用人工神经网络预测食管癌患者的生存率。《癌症》。(2005) 103(8):1596–605.
  21. Zhu M, Xu C, Yu J, Wu Y, Li C, Zhang M, et al. 使用计算机辅助诊断内镜超声(EUS)图像区分胰腺癌和慢性胰腺炎:诊断测试。《PLOS ONE》。(2013) 8(5):e63820.
  22. Saftoiu A, Cazacu I, Udristoiu A, Gruionu L, Iacob A, Gruionu G. 胰腺癌中的人工智能:走向精准诊断。《内镜超声》。(2019) 8(6):357.
  23. Ruffle JK, Farmer AD, Aziz Q. 人工智能辅助胃肠病学——前景与陷阱。《美国胃肠病学杂志》。(2018) 114(3):422–8.
  24. Wang P, Berzin TM, Glissen Brown JR, Bharadwaj S, Becq A, Xiao X, et al. 实时自动检测系统提高结肠镜检查中息肉和腺瘤检测率:一项前瞻性随机对照研究。《肠道》。(2019) 68(10):1813–9.
  25. de Groof AJ, Struyvenberg MR, van der Putten J, van der Sommen F, Fockens KN, Curvers WL, et al. 深度学习系统以比内窥镜医生更高的准确性检测巴雷特食管患者的肿瘤,在具有基准测试的多步骤培训和验证研究中。《胃肠病学》。(2020) 158(4):915–29.
  26. Halcox JPJ, Wareham K, Cardew A, Gilmore M, Barry JP, Phillips C, et al. 使用AliveCor心率监测器进行远程心律采样评估以筛查心房颤动。《循环》。(2017) 136(19):1784–94.
  27. Raja JM, Elsakr C, Roman S, Cave B, Pour-Ghaz I, Nanda A, et al. Apple Watch、可穿戴设备和心律:我们处于什么位置?《转化医学年鉴》。(2019) 7(17):417–417.
  28. Briganti G, Le Moine O. 医学中的人工智能:今天和明天。《前沿医学(洛桑)》。(2020) 7:509744.
  29. Dorsey ER, Glidden AM, Holloway MR, Birbeck GL, Schwamm LH. 远程神经病学和移动技术:神经护理的未来。《自然评论神经病学》。(2018) 14(5):285–97.
  30. Johnson KB, Wei W, Weeraratne D, Frisse ME, Misulis K, Rhee K, et al. 精准医学、人工智能和个性化医疗的未来。《临床转化科学》。(2020) 14(1):86–93.
  31. Huang C, Clayton EA, Matyunina LV, McDonald LD, Benigno BB, Vannberg F, et al. 机器学习以高准确性预测个体癌症患者对治疗药物的反应。《科学报告》。(2018) 8(1):16444.
  32. Williams AD, Andrews G. 互联网认知行为疗法(ICBT)在初级保健中治疗抑郁症的有效性:质量保证研究。《PLOS ONE》。(2013) 8(2):e57447.
  33. Liu X, Faes L, Kale AU, Wagner SK, Fu DJ, Bruynseels A, et al. 深度学习性能与医疗保健专业人员在从医学成像检测疾病方面的比较:系统综述和荟萃分析。《柳叶刀数字健康》。(2019) 1(6):e271–97.
  34. Shafi S, Parwani AV. 诊断病理学中的人工智能。《诊断病理学》。(2023) 18:109.
  35. Lu MY, Chen B, Williamson DFK, Chen RJ, Zhao M, Chow AK, et al. 用于人类病理学的多模态生成式人工智能助手。《自然》。(2024) 634(8033):466–73.
  36. Hu D, Zhang S, Liu Q, Zhu X, Liu B. 大型语言模型在总结肺癌中文放射学报告印象方面的应用:评估研究。《医学互联网研究杂志》。(2025) 27:e65547.
  37. Raghunathan K, Morris ME, Wani TA, Edvardsson K, Peiris C, Fowler-Davis S, et al. 使用人工智能改善选定相关健康学科中的医疗保健交付:范围综述方案。《BMJ Open》。(2025) 15(3):e098290.
  38. Nelson KM, Chang ET, Zulman DM, Rubenstein LV, Kirkland FD, Fihn SD. 在国家卫生系统中使用预测分析指导患者护理和研究。《普通内科杂志》。(2019) 34(8):1379–80.
  39. Jumper J, Evans R, Pritzel A, Green T, Figurnov M, Ronneberger O, et al. 具有AlphaFold的高精度蛋白质结构预测。《自然》。(2021) 596(7873):583–9.
  40. Zhavoronkov A, Ivanenkov YA, Aliper A, Veselov MS, Aladinskiy VA, Aladinskaya AV, et al. 深度学习实现DDR1激酶抑制剂的快速识别。《自然生物技术》。(2019) 37(9):1038–40.
  41. Stokes JM, Yang K, Swanson K, Jin W, Cubillos-Ruiz A, Donghia NM, et al. 抗生素发现的深度学习方法。《细胞》。(2020) 180(4):688–702.e13.
  42. Bhatt DL, Mehta C. 临床试验的适应性设计。《新英格兰医学杂志》。(2016) 375(1):65–74.
  43. Libbrecht MW, Noble WS. 机器学习在遗传学和基因组学中的应用。《自然综述遗传学》。(2015) 16(6):321–32.
  44. Topol EJ. 高性能医学:人类和人工智能的融合。《自然医学》。(2019) 25(1):44–56.
  45. Beltagy I, Lo K, Cohan A. SciBERT:用于科学文本的预训练语言模型。2019年经验自然语言处理会议和第9届国际自然语言处理联合会议(EMNLP-IJCNLP)论文集,第3615-3620页,中国香港。计算语言学协会(2019)。
  46. Rajkomar A, Hardt M, Howell MD, Corrado G, Chin MH. 确保机器学习中的公平性以促进健康公平。《内科学年鉴》。(2018) 169(12):866–72.
  47. Lapointe L. 让医生接受新信息技术:来自案例研究的见解。《加拿大医学会杂志》。(2006) 174(11):1573–8.
  48. Haag M, Igel C, Fischer MR; 德国医学教育学会(GMA),"数字化-技术辅助学习和教学"委员会;德国医学信息学、生物统计学和流行病学协会(gmds)和德国信息学协会(GI)的联合工作组"医学技术增强教学和学习(TeLL)"。数字教学和数字医学:需要国家倡议。《GMS医学教育杂志》。(2018) 35(3):Doc43.
  49. Verghese A, Shah NH, Harrington RA. 这台计算机需要的是医生。《美国医学会杂志》。(2018) 319(1):19.
  50. Huang X, Gu L, Sun J, Eils R. 弥合差距:克服在医疗保健中实施AI的挑战。《医学》。(2025) 6(4):100666.
  51. Nassiri K, Akhloufi MA. 大型语言模型在医疗保健中的最新进展。《生物医学信息学》。(2024) 4:1097–143.
  52. Mittelstadt B. 与健康相关的物联网的伦理:叙述性综述。《信息与技术伦理学》。(2017) 19(3):157–75.
  53. Brouillette M. 人工智能加入医学生课程。《自然医学》。(2019) 25(12):1808–9.
  54. Kelly CJ, Karthikesalingam A, Suleyman M, Corrado G, King D. 为提供临床影响带来人工智能的关键挑战。《BMC医学》。(2019) 17(1):195.
  55. Kermansaravi M, Chiappetta S, Shahabi Shahmiri S, Varas J, Parmar C, Lee Y, et al. 国际专家共识:代谢和减肥手术中人工智能的当前状况和未来前景。《科学报告》。(2025) 15(1):9312.
  56. Martin GL, Jouganous J, Savidan R, Bellec A, Goehrs C, Benkebil M, et al. 验证人工智能以支持使用全国药物警戒数据自动编码患者不良药物反应报告。《药物安全》。(2022) 45(5):535–48.
  57. Saria S. 计算科学家面临的3万亿美元挑战:转变医疗保健交付。《IEEE智能系统》。(2014) 29(4):82–7.
  58. Shademan A, Decker RS, Opfermann JD, Leonard S, Krieger A, Kim PC. 监督自主机器人软组织手术。《科学转化医学》。(2016) 8(337)。
  59. Thirunavukarasu AJ, Ting DSJ, Elangovan K, Gutierrez L, Tan TF, Ting DSW. 医学中的大型语言模型。《自然医学》。(2023) 29(8):1930–40.
  60. Agafonov O, Babic A, Sousa S, Alagaratnam S. 社论:医疗保健的可信AI。《前沿数字健康》。(2024) 6:1427233.
  61. Murdoch B. 隐私和人工智能:在新时代保护健康信息的挑战。《BMC医学伦理》。(2021) 22(1):122.
  62. 信息专员办公室。我们如何确保AI中的合法性?(无日期)。
  63. Sattar NA, Ahmed AR, Ahmad SJS, Shah MA, Wahid A. 基于区块链的电子投票系统的系统文献综述。《计算机科学程序》。(2022) 199:81–8.
  64. 世界卫生组织。健康领域人工智能的伦理和治理:世卫组织指南。世界卫生组织(2021)。
  65. AI法案:法案文本。AI法案探索者(2024)。
  66. 欧洲联盟。2017年4月5日欧洲议会和理事会关于医疗器械的第(EU) 2017/745号条例。《欧盟官方公报》。(2017) 117:1–175。
  67. 卫生与公众服务部(HHS)。HIPAA专业人士:隐私、法律与法规。HHS.gov(无日期)。

关键词:人工智能,机器学习,深度学习,大型语言模型,生成式人工智能,数字健康,医疗保健,外科

【全文结束】

大健康
大健康