(图片来源:Pexels的Ivan S)
根据加利福尼亚大学洛杉矶分校医疗中心进行的一项新的随机临床试验,旨在自动记录患者就诊的人工智能(AI)工具在减少医生文书工作时间方面显示出潜力,并可能改善他们的工作体验。
这项发表在《新英格兰医学杂志》AI分刊上的研究,在真实临床实践中检验了两种商业可用的人工智能听录应用程序——微软DAX和Nabla。在14个专业领域的238名医生和72,000次患者就诊中,研究人员发现,与常规护理(对照组)相比,Nabla用户将其文书工作时间减少了近10%,而两种工具都显示出对医生职业倦怠和工作相关压力的潜在益处。
"文书工作负担已成为医生职业倦怠的主要原因,医生通常每进行一小时的患者护理就要花费两小时在文书工作上,"加利福尼亚大学洛杉矶分校医疗中心首席人工智能官、主要作者Paul Lukac博士说。"这是首次通过随机试验严格评估人工智能听录工具是否能兑现其帮助解决这一问题的承诺。"
研究方法
研究团队在2024年11月至2025年1月的两个月期间,随机分配医生使用两种人工智能听录工具中的一种,或继续其常规文书工作实践。人工智能听录工具记录患者对话并自动生成临床记录草稿,然后由医生进行审核和编辑。
使用Nabla的医生平均每份记录的书写时间估计减少了41秒(从4分30秒减少到3分49秒),而对照组减少了18秒(从4分22秒减少到4分4秒)。Nabla组的减少幅度比对照组大9.5%——这是一个统计学上显著的结果。使用DAX的医生显示出较小的减少幅度,与对照组相比未达到统计学显著性。
关键的是,两种人工智能工具在经过验证的医生职业倦怠、认知工作量和工作疲惫测量指标上都显示出适度的改善,尽管这些发现需要在更大规模的研究中得到证实。例如,与对照组相比,Nabla组和DAX组的医生在职业倦怠评分上经历了约7%的改善。
权衡益处与担忧
研究还揭示了重要局限性。医生报告称,人工智能生成的记录"偶尔"包含临床显著的错误,最常见的是信息遗漏或代词错误。研究期间报告了一起轻微的患者安全事件。
"这项技术需要医生的主动监督,而不是被动接受,"加利福尼亚大学洛杉矶分校医疗中心内科医生、资深作者John N. Mafi博士说。
"我们的试验表明,虽然人工智能听录工具带来了可衡量的益处,但它们偶尔会产生临床显著的错误。医生必须在审查人工智能生成的记录时保持警惕。前进的道路需要在通过严格评估和持续监测维护医学对患者安全的基本承诺的同时,拥抱创新。"
调查结果显示,医生认为这两种工具易于学习和使用,并感觉它们能够促进与患者的更好互动。患者普遍对这项技术持接受态度,拒绝使用该技术的患者不到10%。
对医疗保健的意义
医生职业倦怠影响了近一半的美国医生,并导致劳动力短缺、医疗错误增加以及医疗系统损失数十亿美元。电子健康记录虽然在许多方面改善了护理,但也增加了大量的文书工作要求。
随着全国医疗系统迅速采用人工智能听录工具(通常未经对其有效性和安全性进行严格评估),该研究提供了及时的证据。
"通过将随机试验嵌入常规实践中,我们提供了应该指导医疗保健中实施人工智能决策的高质量、真实世界证据,"Lukac说。"这种方法可以作为负责任地评估新兴的其他人工智能工具的模型。"
研究人员指出,由于研究是在相对较短的时间内在一个学术医疗中心进行的,他们的发现可能不会广泛适用于所有实践环境。他们呼吁在多个机构进行更长期的研究,以确认这些发现并测量对重要健康结果的下游影响,例如护理的质量、成本和体验。
更多信息: Paul J. Lukac等人,《临床实践中的环境人工智能听录工具:一项随机试验》,《新英格兰医学杂志》AI分刊(2025)。DOI: 10.1056/aioa2501000
由加利福尼亚大学洛杉矶分校提供
【全文结束】


