生成式人工智能(AI)在医疗保健领域带来了颠覆性的创新,但也面临某些挑战。检索增强生成(RAG)通过利用外部知识检索,使模型能够生成更可靠的内容。在这篇文章中,我们分析了RAG可能为医疗保健带来的贡献,特别是在公平性、可靠性和个性化方面。此外,我们讨论了在医疗场景中实施RAG的当前局限性和挑战。
引言
生成式人工智能(AI)最近在各个领域引起了广泛关注,包括用于文本生成的GPT系列和LLaMA系列、用于图像生成的DALL-E以及用于视频生成的Sora。在医疗系统中,生成式AI在咨询、诊断、治疗、管理和教育等方面具有潜在的应用前景。此外,利用生成式AI可以提高医疗服务的质量,减轻临床医生的工作负担。
然而,必须认识到生成式AI模型的固有限制,包括易受预训练数据偏差的影响、缺乏透明度、可能生成错误内容以及难以保持最新知识等。例如,大型语言模型(LLMs)被发现会生成带有过时种族方程式的偏见响应,以估计肾功能。在图像生成过程中,观察到了与性别、肤色和地理文化因素相关的偏差。同样,在问答等下游任务中,LLM生成的内容往往事实不一致且缺乏验证证据。此外,由于其静态知识和无法访问外部数据,生成式AI模型无法为医生提供最新的临床建议或为患者提供有效的个性化健康管理。
为了解决这些挑战,检索增强生成(RAG)作为一种潜在解决方案被探索。通过向模型提供外部检索的数据,RAG可以提高生成内容的可靠性。典型的RAG框架包括三个部分(图1):索引、检索和生成。在索引阶段,外部数据被分割成块,编码成向量并存储在向量数据库中。在检索阶段,用户的查询被编码成向量表示,然后通过查询和向量数据库中信息之间的相似性计算检索最相关的信息。检索技术不仅限于密集检索,还包括稀疏和混合检索方法,以及高级重排序方法以提高检索内容的相关性。在生成阶段,用户的查询和检索到的相关信息一起提示模型生成内容。与特定任务的模型微调相比,RAG通常更计算高效,并已被证明可以提高知识密集型任务的准确性,提供更灵活的模型更新和与其他AI技术集成的范式。
在这篇文章中,我们讨论了RAG在生成式AI背景下的作用,特别是其在医疗保健中的可能应用。我们从三个方面考察了RAG的可能贡献:公平性、可靠性和个性化(图2)。此外,我们探讨了RAG在医疗应用场景中的局限性,强调进一步研究以理解其在医疗系统中实施的影响。
在生成式AI应用中促进医疗公平性
减少偏见
由生成式AI模型生成的内容可能会延续预训练数据中固有的偏见,这些偏见体现在人口统计特征、政治意识形态和性取向等方面。这种偏见不仅可能导致不公平的诊断和治疗,还会加剧特定人群的健康不平等。
RAG可以从外部知识来源(如医学文献、临床指南和病例报告)获取信息,以优化生成式AI模型的输出。通过检索特定亚人群的信息,模型可以从多个角度分析患者的状况,从而减少生成内容中包含的偏见风险。例如,针对不同性别群体,RAG可以检索其特定的生理模式、常见疾病谱、临床表现及相关临床实践建议的研究成果。对于不同的种族群体,RAG可以访问涉及其遗传、环境和生活方式因素的研究报告,以了解疾病发病率差异和独特的症状表现。此外,对于其他特定亚人群(如不同年龄组、社会经济地位等),RAG可以检索定制的医学证据,以全面了解其独特的健康需求。尽管确保高质量数据的获取仍然是一个挑战,但RAG提供了可能的解决方案来缓解这些问题。
缓解差异
健康差异对边缘化群体在获取医疗资源和服务方面提出了额外挑战,可能阻碍公平目标的实现。尽管生成式AI模型是在大量数据上训练的,但预训练数据本身在代表不同群体方面存在不平衡。例如,GPT-3的预训练语料库中有92.64%来自英文资料,导致对使用其他语言的社区覆盖有限。这种偏斜使得满足未代表群体的医疗需求变得困难。
收集特定于这些未代表群体的数据并将其纳入RAG系统,有可能缓解医疗保健中的差异。具体来说,在资源匮乏地区,RAG系统可以利用整合当地医学研究文献、临床指南和实践经验的知识,为当地居民提供更相关的诊断和治疗建议。虽然一些区域指南可能尚未数字化,但音频和图像识别技术可以将这些信息转换为数字格式,创建特定地区的上下文数据库。同样,通过开发高质量的多语言医学知识库,RAG可以在跨语言信息检索和知识整合中发挥重要作用,消除语言差异造成的障碍。然而,值得注意的是,即使是最先进的LLMs目前也仅支持少数主流语言,这限制了RAG在多语言环境中的有效性,尤其是在处理低资源设置的语言时。此外,RAG系统能够检索预先收集的材料,并以文本、图像和视频等多种格式呈现,以促进患者教育。这种方式允许向具有不同教育和文化背景的患者解释复杂的医学概念。
生成可靠内容
减轻错误
生成式AI模型在医疗保健中的一个重要挑战是它们可能生成错误或不准确的信息。尽管已经有特定模型经过大量医学数据的预训练,如Med-PaLM2和Med-Gemini,但“幻觉”现象仍然无法避免。这个问题极其敏感,因为任何与疾病诊断、治疗计划或药物指导相关的虚假信息都可能对患者造成严重伤害。
例如,用药错误是一个主要的医疗错误类别,每年导致众多患者死亡。在将处方指示转换为标准格式的过程中,药房技术人员可能会错误记录剂量、频率或给药途径。此外,当患者将药物从原始包装转移到其他容器时,药剂师难以识别药物,可能导致遗漏错误。鉴于电子病历建议和警报通常不够精确,传统自然语言处理方法需要大量人工标注,生成式AI提供了一个有吸引力的解决方案。然而,生成式AI模型有时也会生成错误的药物信息,导致进一步危害。RAG可能有助于解决这些问题。通过搜索各种药物信息,RAG可以在数据输入阶段自动解析处方,生成更准确的药物指导,从而减少因信息传递引起的医疗错误。此外,在药物识别过程中,多模态RAG系统能够识别药物的外观特征,如颜色、形状和印记。通过匹配这些特征与数据库信息,RAG系统可以生成可靠的药物信息,供药剂师参考,从而提高药物识别效率。然而,必须强调的是,这些应用仍处于早期发展阶段,需要彻底验证才能实施。
提高透明度
生成式AI模型的“黑箱”特性使其难以解释特定诊断或治疗建议是如何得出的。这种缺乏透明度不仅削弱了医生和患者对生成内容的信任,更重要的是,它可能带来严重的医疗风险和伦理问题。尽管一些研究试图通过链式思维、多代理讨论和事后归因等方法增强模型的推理能力和透明度,但在医学应用中仍有局限性。
相比之下,RAG可以从外部知识库中检索可追溯的医学事实,促进更透明内容的生成;然而,这个过程仍需人工验证。在辅助临床决策时,RAG可以提供诊断依据的信息来源,包括临床指南、医学证据和临床案例。通过将查询分类为简单的事实搜索或多步推理过程,RAG可以进一步澄清不同类型的信息如何贡献于某一建议,提高其决策透明度。此外,一些研究利用外部医学知识图谱(如统一医学语言系统)或自定义知识图谱来增强模型的诊断能力。基于给定查询,RAG系统首先识别知识图谱中相关的节点,如疾病、症状或药物,然后检索直接关系和连接这些节点的多跳路径。这一过程使RAG系统能够高效提取结构化的相关知识,并利用它提供清晰的诊断解释。
个性化医疗服务
健康管理
RAG在个性化健康管理方面也显示出潜力。生成式AI模型缺乏结合个人信息的能力,难以提供有效的健康服务。例如,它们可能不知道用户的过敏情况并推荐致敏食物。相比之下,RAG系统可以整合个人的健康数据和生活习惯,构建全面的个人资料,从而提供更个性化的健康指导。
对于患者,通过连接他们的病历和临床数据并允许实时更新,RAG系统能够提供更精确的健康管理指导。例如,对于需要长期服用多种药物的慢性病患者,该系统可以根据医生的处方生成药物提醒,确保患者按时按量服药,从而提高药物依从性。对于公众,RAG系统可以分析个人健康数据、生活方式、环境因素和遗传信息(如果用户授权访问),以识别潜在的健康风险。通过这种方式,RAG系统提供个性化的健康建议,包括饮食、运动和压力管理,有效促进疾病预防。例如,对于有较高遗传风险的心脏病患者,该系统可以推荐具体的饮食计划和适当的运动方案,以降低最终患病的风险。
精准医疗
精准医疗旨在根据患者的基因特征、环境影响、生活方式和其他个体因素,最大化医疗效果和患者受益。尽管当前的生成式AI模型已在临床决策支持方面展现出潜力,但在精准医疗方面仍面临挑战,难以利用高度个性化的患者数据提供精确的治疗建议。
RAG可能在推进精准医疗方面具有独特优势。通过检索患者的复杂临床和分子数据,RAG系统使医生能够为每位患者制定更准确和个性化的治疗计划。例如,生成式AI模型通常为表现出类似症状的癌症患者提供类似的通用临床建议。然而,实际上这些患者由于生物标志物(如DNA、RNA、蛋白质、代谢物、宿主细胞和微生物群)的不同,通常有不同的疾病进展和预后。尽管收集和保护这类敏感数据仍是一个挑战,但RAG可以更好地利用这些信息进行精准医疗实践。具体而言,RAG系统可以全面分析患者的生物标志物,将其分类为更精细的亚组,并根据既定临床指南向医生推荐适当的个性化治疗方案。
讨论
RAG可以使生成式AI更好地融入医疗系统,并在咨询、诊断、治疗、管理和教育方面带来更多的创新应用。尽管RAG系统在医疗保健中具有潜力,但也面临显著的局限性。首先,外部知识的检索可能会引入额外的偏见,因为来源本身可能含有偏见。其次,由于缺乏足够的高质量信息,RAG系统在处理未代表群体时可能效果不佳,生成的内容更多依赖于模型本身的知识。因此,少数群体不太可能从现有的RAG系统中受益。第三,尽管RAG系统可以通过提供证据来提高透明度,但确定响应的哪些部分来源于哪些检索到的知识仍然需要人工检查。同时,检索文件之间或与模型内部知识之间的可能知识冲突突显了源验证的重要性,尽管有效实施仍具挑战性。第四,RAG系统面临一定的隐私风险,因为检索数据库中存储的敏感信息可以通过设计的提示提取。实施适当的隐私保护机制对于减少生成内容中的信息泄露风险至关重要,尤其是在处理敏感医疗信息时。因此,我们建议临床医生、研究人员、利益相关者和监管机构之间进行跨学科合作,探讨如何更公平、可靠和有效地使用RAG,以改善现有医疗实践。这种合作应侧重于解决实际挑战,包括确保与电子病历系统的互操作性、建立临床医生信任以及为医疗专业人员提供充分培训,以充分利用RAG的潜力。
(全文结束)


