背景/目标:大语言模型的应用近期在研究界引发高度关注,推动生成式人工智能在医疗健康领域的解决方案开发与采纳。本研究作为慢性病领域首项元综述(即系统性综述的回顾),聚焦心血管疾病、癌症和精神障碍,旨在识别其在患者诊疗中的价值,以及实施与临床应用面临的挑战。
方法:依据系统综述与荟萃分析首选报告项目指南,在PubMed和Scopus文献数据库开展检索,筛选纳入大语言模型的系统性综述。对综述中包含的原始研究,按目标疾病、具体应用、所用大语言模型、数据来源、准确度及关键结果进行综合分析。
结果:文献检索共识别5项符合纳入排除标准的系统性综述,涵盖81项独特的大语言模型解决方案。其中精神疾病领域占比最高(70项研究,86%),其次为癌症(6项,7%)和心血管疾病(5项,6%)。生成式预训练变换器模型应用最广泛(45项,55%),其次是双向编码器表示变换器模型(33项,40%)。主要应用场景包括抑郁检测与分类(31项,38%)、自杀意念识别(6项,7%)、基于诊疗指南的问答系统(6项,7%)以及情绪分类(4项,5%)。研究异质性显著:50%的研究(41项)聚焦临床/诊断准确度,采用正确诊断率、指南符合度或模型性能等指标;42%的研究(34项)为描述性研究,关注叙事性结果、可用性、信任度或合理性。开发与评估过程中的核心挑战包括准确性不一致、偏见检测与缓解、模型透明度、数据隐私、持续人工监督需求、伦理关切与规范,以及高质量研究的设计实施。
结论:本综述结果表明,大语言模型有望成为提升心血管疾病、癌症及精神健康领域诊断精准度与决策支持的有力工具。鉴于纳入研究数量有限且质量中等,研究团队呼吁学界在真实干预场景中开展更多探索,以充分验证大语言模型的临床实用价值。
【全文结束】


