基于大型语言模型的AI智能体驱动的模拟患者系统有望变革医学教育Simulated patient systems powered by large language model-based AI agents offer potential for transforming medical education | Communications Medicine

环球医讯 / AI与医疗健康来源:www.nature.com美国 - 英语2025-12-21 11:37:18 - 阅读时长2分钟 - 949字
基于大型语言模型的人工智能模拟患者系统AIPatient在医学教育中展现出革命性潜力,该系统通过六个特定任务的AI智能体协同工作,结合检索增强生成框架和基于真实患者数据构建的知识图谱,实现了94.15%的医学问答准确率,其知识库有效性达F1分数0.89,可读性测试显示Flesch阅读难易度中位数68.77且年级水平适中,医学生评估证实其在病史采集中的高保真度和教育价值已达到或超越人类模拟患者水平,有望解决传统模拟患者培训成本高、规模受限的问题,为医学教育提供可扩展、标准化且高性价比的创新解决方案。
大型语言模型AI智能体模拟患者系统医学教育AIPatient电子健康记录MIMIC-III知识图谱医学问答医学生高保真度
基于大型语言模型的AI智能体驱动的模拟患者系统有望变革医学教育

基于大型语言模型的AI智能体驱动的模拟患者系统有望变革医学教育

摘要

背景:

模拟患者系统在医学教育和研究中至关重要,提供安全、综合的培训环境并支持临床决策。渐进式人工智能(AI)技术,如大型语言模型(LLM),可通过高保真度和低成本复制医疗状况与医患互动,从而推进模拟患者系统发展。然而,系统有效性和可信度仍是主要挑战。

方法:

我们开发了AIPatient,一种由基于LLM的AI智能体驱动的模拟患者系统。该系统整合检索增强生成(RAG)框架,由六个特定任务的LLM智能体支持复杂推理过程。为提升模拟真实性,系统基于重症监护医学信息集市(MIMIC)-III数据库的去标识化真实患者数据构建AIPatient KG(知识图谱)。

结果:

本研究证实该系统在电子健康记录(EHR)医学问答(QA)、可读性、鲁棒性和稳定性方面表现卓越。当全部六个智能体协同工作时,系统QA准确率达94.15%,显著优于部分或无智能体集成的基准测试。其知识库展现高有效性(F1分数=0.89)。可读性评估显示Flesch阅读难易度中位数为68.77,Flesch-Kincaid年级中位数为6.4,表明内容适合所有医疗专业人员理解。鲁棒性与稳定性通过非显著方差验证(ANOVA F值=0.6126,p>0.1;F值=0.782,p>0.1)。针对医学生的用户研究表明,AIPatient在病史采集中提供高保真度、高可用性和卓越教育价值,表现达到甚至超越人类模拟患者。

结论:

基于大型语言模型的模拟患者系统能提供准确、易读且可靠的医疗交互体验,展现出变革医学教育的显著潜力。

简明语言摘要

模拟患者系统用于在真实但安全的临床环境中培训医学生。然而,由人类演员扮演的模拟患者存在成本高昂且难以规模化的问题。本研究开发的AIPatient人工智能系统,能够基于现有真实电子健康记录模拟多样化患者互动。经评估,该系统在医学问题解答中达到高准确率,输出回应清晰一致,且被医学生评为高度真实。与人类模拟患者相比,AIPatient在病史采集等关键环节表现相当甚至更优。这些成果表明,基于AI的模拟患者技术有望使医学教育更加普及、可扩展,并在不同培训环境中保持一致性,为全球医学教育提供创新解决方案。

【全文结束】

大健康
大健康