大语言模型在总结复杂癌症病理报告方面表现优于医生 - AI与医疗健康

大语言模型在总结复杂癌症病理报告方面表现优于医生LLMs outperform doctors at summarizing complex cancer pathology reports • healthcare-in-europe.com

环球医讯 / AI与医疗健康来源：healthcare-in-europe.com美国 - 英语2026-05-19 10:56:25 - 阅读时长3分钟 - 1426字

西北大学医学院的一项新研究表明，开源大语言模型在总结复杂癌症病理报告方面比医生表现更好，特别是在捕捉对治疗决策至关重要的分子和基因发现方面。该研究测试了由Meta、Google、DeepSeek和Mistral AI开发的六种模型，发现AI生成的摘要比医生撰写的版本更全面，可能帮助临床医生在时间压力下更高效地处理大量信息，减少关键细节被遗漏的风险，使医生能更专注于患者护理。研究人员强调，AI是作为增强而非替代临床决策的工具，可帮助突出关键发现、识别缺失信息并提高文档一致性，尤其对患有复杂癌症的患者具有重要意义。

根据西北医学的一项新研究，人工智能模型可以比医生生成更完整的复杂癌症病理报告摘要，该研究测试了由Meta、Google、DeepSeek和Mistral AI开发的六种模型。该研究发表在《JCO临床癌症信息学》期刊上，这是美国临床肿瘤学会的期刊。这些发现为肿瘤学中日益增长的挑战提供了一个潜在解决方案。随着生物标志物检测的扩展和患者寿命的延长，病理报告变得越来越详细和纵向，通常跨越多个医疗机构，要求临床医生在巨大的时间压力下整合大量信息。

在这项研究中，几种开源AI模型始终生成比医生撰写的版本更全面的摘要，特别是在捕捉对治疗决策至关重要的分子和基因发现方面。"随着癌症护理变得越来越复杂，综合复杂报告的负担正在迅速增加，"西北大学费恩伯格医学院放射肿瘤学系主任兼教授、研究资深作者Mohamed Abazeed博士说。"我们看到的是，AI可以帮助确保关键的病理和基因组细节始终被捕捉到——不是作为医生的替代品，而是作为增强临床决策的工具。"

西北大学研究人员分析了94份肺癌患者的匿名病理报告。这些报告包括详细描述以下内容的文本：

组织病理学发现（显微镜下的肿瘤特征）
免疫组织化学结果（蛋白质表达检测）
与治疗相关的分子和遗传数据

AI模型分析了这些报告的文本内容并生成了结构化摘要。AI生成的摘要与医生先前撰写的临床摘要进行了比较。一组肿瘤学家评估了每个摘要的准确性、完整性、简洁性和潜在临床风险。在各种模型中，AI生成的摘要始终被评为更完整，最大的差异体现在分子和基因组发现的包含上。"如果AI能够可靠地综合这些报告，临床医生可以更高效地审查关键发现，重要的遗传细节不太可能被忽视，文档也变得更加标准化，"费恩伯格放射肿瘤学讲师、研究合著者Troy Teo说。"这可以帮助医生更专注于患者护理。"

科学家们评估了六种开源语言模型：Meta的Llama 3.0、3.1和3.2模型，Google的Gemma 9B，Mistral 7.2B和DeepSeek-R1。这些不是像ChatGPT这样的聊天机器人，而是研究人员可以下载并在本地运行的系统。根据研究，表现最好的是DeepSeek和Llama 3.1。西北大学团队目前正在使用Llama 3.1开发一个应用程序，最终将允许医生上传病理报告并接收AI生成的摘要供他们审查。但研究作者强调，在部署该应用程序之前，他们需要进行更多的测试和验证研究。

作者表示，他们将AI视为增强而非替代临床专业知识的支持层。它可以帮助突出关键发现，识别缺失信息并提高文档的一致性。"患有复杂癌症的患者可能受益最大，"西北大学麦高医学中心放射肿瘤学五年级住院医师、研究第一作者刘一荣博士说。"在缺失关键病理发现或可操作的遗传标记可能改变治疗决策的情况下，确保信息始终被捕捉到至关重要。"患者寿命更长，并且正在接受重复的活检和基因测序，"刘补充道。"他们的报告可能长达几十页。即使一个细节被遗漏也可能影响护理，这就是AI可能提供有意义支持的地方。"

该研究题为"利用大语言模型自动化总结癌症病理报告以提高临床可用性"。Troy Teo获得了加拿大卫生研究院（资助号CIHR-472392）和亚马逊网络服务的社会影响基金的资助。

【全文结束】