准备好开始看到AI摘要遍布医疗保健领域吧。
想象一下,一位1990年代的内分泌科医生在她的诊所接诊新病人。首先,她会查看初级保健医生传真过来的转诊信,并浏览病人的入院表格。然后,她进入检查室,询问并检查病人,制定治疗计划。
离开房间后,她在有横线的散页纸上草草写下几句话,并在订单和账单表格上打勾。她的办公室工作人员将她的笔记归档到纸质病历中,将订单传真给实验室,并将索赔邮寄给保险公司。
时代变了。2025年,这位(现在年长的)内分泌科医生在她诊所前一天晚上花费两个小时,识别并记录第二天患者冗长的医疗记录中的相关信息。
第二天早上,在等待工作人员上传第一个患者的血糖仪数据时,她快速浏览了她过载的电子健康记录(EHR)收件箱,匆忙回应患者门户消息、批准两项新的续药请求,并回答编码查询。
当患者准备就绪时,她走进房间,自我介绍并倾听他的故事,频繁切换屏幕以验证某些信息,例如他提到几周前在邻近的医疗系统进行的压力测试。
在访问结束时,她概述了一个计划,输入了一些命令,选择了计费和诊断代码,并点击通过一个她已经学会忽略的无关决策支持弹窗。已经晚了15分钟,她想着退休,庆幸至少她的新AI书记员会写大部分笔记。
正如几十年前John Naisbitt预测的那样,所有医疗工作者——包括像我这样的医生——都在“信息泛滥但知识匮乏”。医院每年平均产生50拍字节的数据,相当于连续播放一部两小时的电影2500万次。典型的医疗记录的字数超过了莎士比亚最长的作品《哈姆雷特》的一半。大多数记录充斥着冗余信息,有些几乎无法理解。
因此,我们反复指点、点击、切换、扫描和搜索,在巨大的数据堆中寻找少量相关的信息。我们同时打字、点击、复制和粘贴,捕捉更多细节并添加数字废料。
这项工作偷走了我们的注意力,占用了我们的时间,耗尽了我们的精力。我们有时会错过(或误解)重要信息,导致更糟糕的决策,让患者漏诊。我们迫切需要帮助。
AI可以帮助我们更有效地管理信息洪流。让我解释一下它是如何做到的。
生成AI摘要的方法有很多。大多数涉及以下几个关键步骤:
- 从各种来源(EHR、健康信息交换、图像、环境书记员、保险索赔、生物传感器等)摄取原始数据。
- 处理数据,通过清理、规范化、结构化和分类。
- 搜索并识别给定任务和场景中最相关的数据。过滤掉重复和过时的数据。
- 生成连贯的摘要。
- 评估和/或纠正摘要中的错误。
- 在工作流程的适当部分显示摘要,最好链接到源。
底层技术可能包括自然语言处理、检索增强生成、预测模型、启发式方法、临床知识图谱、对抗检测系统和人工参与的升级系统。
“医学本质上是一门信息和数据处理学科。”——Zak Kohane博士
AI摘要将触及几乎所有医疗工作流程。正如哈佛信息学家Zak Kohane博士解释的那样,“医学本质上是一门信息和数据处理学科。”所有医疗工作者——包括儿科外科医生、物理治疗师、住院护士、护理管理人员和呼叫中心员工——反复收集、总结和处理信息以做出决策并记录他们的活动。
许多科技公司和医疗机构正在合作,将摘要功能编织进各种临床和行政工作流程中。最明显的是,AI摘要可以帮助临床医生快速了解患者的情况,无论是初次见面几个月的初级保健医生、执行咨询的心脏病专家、准备手术的麻醉师、解读CT扫描的放射科医生,还是开始轮班的急诊科医生。例如,Navina的AI助手患者摘要可以将家庭医生准备就诊的时间减少三分之一。
AI摘要可能会揭示关键见解,支持临床推理,推荐诊断和计费代码,并识别护理缺口,例如指出带有新心脏支架的患者未服用Plavix,或指出老年女性需要进行DEXA扫描。
摘要还可以通过生成转诊信、出院摘要、护士下班笔记和临床医生笔记来加快文档处理速度。例如,Regard报告称,其住院临床洞察平台用户撰写笔记的时间减少了25%,并且捕获了近20%更多的并发症和共病代码。
这些工具不仅适用于临床医生和护士。定制的AI摘要可以帮助行政人员处理转诊、安排预约和管理来电。Talkdesk的医疗保健总经理Patty Hayward告诉我,他们公司的自动摘要工具使呼叫中心处理时间减少了15%。
AI摘要还可以帮助团队处理保险预授权请求、处理拒绝和满足利用管理要求。它们还可以加速质量报告和向数据注册表提交数据,例如AHA卒中注册表。例如,Layer Health报告称,注册提交时间减少了三分之二。
生成高质量的AI摘要是具有挑战性的。高质量的摘要应准确、清晰、合乎逻辑。它们应全面而简洁。它们应值得信赖。
检索增强生成、基础和归属等技术有助于消除其他AI产品中出现的明显幻觉。然而,更微妙的错误——例如在摘要中添加一个不存在于源中的额外单词(如“发烧”)——可能会影响意义。一种新兴的最佳实践是使摘要“可追溯”,使用户能够快速引用主要摘要来源。
遗漏关键事实和细节可能是更大的问题。不阅读整个记录,用户无法知道重要的信息是否缺失,或者摘要是否按正确的顺序优先排列最相关的信息。
有几个因素使这一挑战更加复杂。一方面,医疗和行政记录混乱不堪,充满了冗余信息,充斥着拼写错误、复制粘贴错误和各种缩写。但“垃圾进,垃圾出”不是低质量摘要的借口。常见的做法是使用知识图谱,确保汇总的信息与已知的临床知识一致。
其次,记录中的信息量通常远远超过大型语言模型的上下文窗口。Abstractive Health的Vince Hartman解释说:“简单地将整个医疗记录输入模型会产生不准确的摘要。”相反,他的公司采用“分块策略”,先对记录的各个部分进行连贯的摘要,然后再将其合并成一个整体摘要。
第三,通常没有一个正确的“答案”来决定摘要中应该包含哪些信息以及在哪里包含。例如,在简要总结因尿潴留住院时,提及患者抑郁症史是否相关?总结——就像更广泛的医学一样——结合了科学和艺术。
Layer Health的CEO兼MIT教授David Sontag认为,通过一组预设的具体问题的准确性视角来验证和监控摘要是最好的方法。这帮助公司决定将其首个产品集中在具有预设数据要求的临床注册表自动化提交上。
与此同时,Regard的CEO Eli Ben-Joseph引用了“瑞士奶酪模型”的安全性,其中多个技术检查和“环内”临床医生相结合,以最大化准确性和最小化风险。
公司Pieces通过将其临床摘要通过对抗AI模型来标记可能的错误。然后由一名受雇于Pieces的医生审查并可能裁定被标记的摘要,然后再传递给一线临床医生。该公司分析了500多万份AI生成的住院摘要,发现严重幻觉的发生率极低(每10万份摘要0.4至10.7起)。
目前,大多数公司只为一两个特定用途生成AI摘要,如预图表、编码或关闭护理缺口。预计许多公司将开始支持多个用户和用途。
例如,Evidently的首席产品官Kalie Dove-Maguire博士解释说,她的公司正在构建一个“灵活的临床智能平台,以支持整个医疗系统的用户”,包括调度员、编码员、护士和临床医生。我对她展示的内容印象深刻。
同样,Regard的临床洞察平台支持医院医生工作流程中的多项任务,包括推荐护理计划、加快临床文档处理,并突出影响风险评分和报销的诊断。
AI摘要将越来越多地与其他AI工具融合,最明显的是AI书记员,它可以有效地将对话转换为笔记。然而,只有三分之一的临床笔记文本来自对话。摘要工具可以捕捉其余三分之二来自医疗记录其他部分的笔记文本。
将摘要与其他综合临床证据和辅助临床决策的工具结合起来可能会特别有影响力。AvoMD的全面AI助手可以总结医疗记录、撰写笔记并支持编码,同时链接到临床路径和证据。
Avo的CEO Yair Saperstein博士设想摘要很快将进入代理工作流程。风险在于“一个断点可能导致所有后续步骤崩溃”。
一个圣杯是使临床医生和其他医疗工作者能够动态查询EHR,提出诸如“2021年核压力测试的指征是什么?”或“为什么停用Eliquis?”之类的问题。这里的关键挑战是减少延迟(即几秒到几分钟的处理时间)。Pieces的CEO Ruben Amarsingham博士向我展示了他们公司如何通过精炼每个患者的记录形成“浓缩液”,用户可以即时查询。这让我想起了William Gibson的名言:“未来已经到来,只是分布不均。”
AI摘要将很快遍布医疗保健领域,帮助临床医生和其他医疗工作者更高效、更可持续地工作。然而,也会有副作用,就像我们经历EHR时一样。我们必须保持清醒。
不断压缩和扩展信息是否会破坏记录系统?Hugh Harvey博士担心“数千/数百万临床记录中未被检测到的多次幻觉可能危险地累积起来,最终在EHR中造成混乱。”反过来,EHR本身已经如此混乱,以至于AI可能是唯一的出路。
我们应该设置多高的标准?虽然AI永远不会创建完美的摘要,但医生和其他医疗工作者也是不完美的摘要者。
我们如何平衡效率和质量?过于精细的信息提取会剥离必要的背景。
我们如何培养足够的意识,知道何时可以依赖AI摘要,何时不能?尽管总结信息可能是乏味的,但它往往有助于我们更好地理解患者。正如Tim Wu在2014年的一篇文章中警告的那样,“便利技术据说让我们专注于重要的事情,但有时候被消除的部分正是重要的。”我们是否有足够的纪律去在必要时深入挖掘?
(全文结束)


