加州大学旧金山分校医疗中心的研究团队于2025年5月5日在《美国医学会内科学杂志》在线发表了一项突破性研究。该研究由Christopher Y.K. Williams医师领衔的24人团队完成,通过对照分析发现大语言模型(LLM)生成的住院患者出院摘要在质量与安全性方面可与医生撰写内容相媲美。
研究指出:"高质量出院摘要与改善患者预后相关,但会增加临床文档工作负担。LLM可通过自动生成叙事内容为医生提供支持。"研究团队对2019-2022年间100例住院3-6天的病例进行双盲评估,由22名主治医师对LLM与医生撰写的摘要从总体质量、内容全面性、简洁性、连贯性及三类错误(不准确、遗漏、幻觉)进行评估,并使用改进版医疗保健研究与质量局量表(0-7分)评估潜在危害性。
研究结果显示:在100例病例中,LLM与医生撰写摘要的总体质量评分(1-5分李克特量表)相当(分数越高质量越好)。LLM生成内容更简洁且更连贯,但全面性逊于医生撰写内容。值得注意的是,LLM与医生在个体错误可能导致的危害风险方面无显著差异。
研究团队特别指出:"尽管LLM生成内容更可能包含错误(尤其是遗漏和不准确),但医生撰写内容同样存在幻觉型错误。这凸显了LLM生成内容与人类认知局限性的相互作用——医生可能在撰写出院摘要时获得新信息,而人类重建住院期间历史事件的能力也可能存在缺陷。"
最终研究结论认为:"LLM生成的出院摘要在质量和安全性方面可与医生撰写内容相媲美,经过人工审核后可能为医院医师提供可行的替代方案。这种AI辅助模式既能保留医疗文书的准确性,又能显著减轻临床文档工作负担。"
参与本研究的完整专家团队包括:Christopher Y. K. Williams, MB BChir;Charumathi Raghu Subramanian医师;Syed Salman Ali医师;Michael Apolinario医师等共计24位来自加州大学旧金山分校的医学专家。
【全文结束】


