许多医生在阅读关于人工智能在患者诊断和治疗方面的高质量建议时都会感到不安,这些建议的质量与人类医生相当甚至更好。没有人相信医生会因为AI而变得过时,但这种进步可以提高他们的表现。
这项新研究由特拉维夫大学伯格拉斯经济学院的数字健康专家丹·泽尔策教授领导,比较了AI和洛杉矶著名西达赛奈医学中心的医生在诊断和治疗建议方面的准确性。由于该中心运营着CS-Connect虚拟紧急护理诊所,决定与以色列初创公司K Health合作。
这篇论文最近在美国医师学会(ACP)年会上发表,并发表在《内科医学年鉴》上,题为“比较人工智能(AI)初始建议和最终医生建议在AI辅助虚拟紧急护理访问中的效果”。
泽尔策解释说:“西达赛奈运营着一个提供远程医疗咨询的虚拟紧急护理诊所,医生们专门从事家庭和急诊护理。”
“最近,一个基于机器学习的AI系统被整合到诊所中——通过专用聊天进行初步接诊,结合患者的医疗记录数据,并在就诊开始时向主治医生提供详细的诊断和治疗建议——包括处方、检查和转诊。”他说。
“当信心足够时,AI会提供诊断和管理建议(处方、实验室检查和转诊),”这位数字健康专家说。“在与算法互动后,患者继续进行视频就诊,最终由医生确定诊断和治疗。为了确保AI建议的可靠性,算法经过数百万病例的训练,在信心水平高时才会提供建议,在大约五分之一的情况下不提供任何建议。”
“在这项研究中,我们比较了AI系统的建议与医生在诊所中的实际决策的质量。”
研究人员检查了一个月内461次在线诊所就诊的样本。研究集中在有相对常见症状的成年患者身上——呼吸系统、牙科、泌尿系统和阴道问题。在所有审查的就诊中,患者首先由算法评估并提供建议,然后在视频咨询中由医生进行治疗。
之后,所有建议——来自算法和医生的——都由四位至少有十年临床经验的医生组成的小组进行评估,每个建议都被评为四个等级之一——最佳、合理、不足或可能有害。评估者根据患者的病史、就诊期间收集的信息以及视频咨询的笔录来评估这些建议。
综合评分得出了令人信服的结论:AI建议在77%的情况下被评为最佳,而医生的决策只有67%;在另一端,AI建议被评为可能有害的比例低于医生的决策(2.8%对4.6%)。在68%的情况下,AI和医生获得了相同的评分;在21%的情况下,算法得分高于医生;在11%的情况下,医生的决策被认为更好。
评估者对评分差异的解释突显了AI系统相对于人类医生的几个优势。
AI的优势
首先,AI更严格地遵守医学协会的指南——例如,不对病毒感染开具抗生素。其次,AI更全面地识别医疗记录中的相关信息,如类似感染的复发情况,这可能会影响适当的治疗方案。第三,AI更精确地识别出可能表明更严重状况的症状,如佩戴隐形眼镜的人报告的眼痛,这可能表明感染。
另一方面,医生比算法更灵活,在评估患者的实际状况方面具有优势。例如,如果一名COVID-19患者报告呼吸急促,医生可能会认为这是相对较轻的呼吸道阻塞,而AI仅基于患者的回答,可能会不必要的将其转诊到急诊室。
泽尔策总结说:“在这项研究中,我们发现,基于有针对性的接诊过程,AI可以提供诊断和治疗建议,在许多情况下比医生更准确。”
“研究的一个局限性是我们不知道有多少医生在可用的病历中查看了AI的建议,或者他们在多大程度上依赖这些建议,”他说。“因此,研究只测量了算法建议的准确性,而不是它们对医生的影响。”
他补充说,这项研究的独特之处在于它在真实环境中测试了算法,而大多数研究则关注认证考试或教科书中的例子。
“我们的研究中包括的相对常见的状况代表了诊所约三分之二的病例量,因此这些发现对于评估AI作为支持医生决策工具的准备情况是有意义的,”泽尔策说。
“我们可以预见不久的将来,算法将在越来越多的医疗决策中发挥作用,将某些数据引起医生的注意,帮助他们更快地做出决策,减少人为错误,”他预测道。“当然,关于如何在诊断和治疗过程中实施AI的最佳方式,以及人类专业知识和AI在医学中的最佳整合,仍有许多问题有待解决。”
当被问及以色列医生是否担心AI会取代他们时,泽尔策表示答案是混合的。
“我不了解以色列是否有具体的调查。一般来说,人们对AI的态度是复杂的:既兴奋于其潜力,又担心其有害和破坏性影响,以及声称其被过度炒作。”
“在医疗保健领域,这一争论并不新鲜,”他解释说。“早在2016年,被称为‘AI教父’的杰弗里·辛顿后来成为诺贝尔奖获得者,曾预测AI将在五年内超越放射科医生。九年过去了,AI在放射学中的准确性有了显著提高,但没有放射科医生因AI而失业。”
“有几个原因导致这种情况。AI在某些任务上表现出色,但在其他任务上落后。医疗系统谨慎且行动缓慢。安全、信任和监管都减缓了采用速度。因此,更有可能的是,我们将看到AI支持医生和护理工作流程,特别是在已经缺乏医护人员的系统中,而不是取代他们。”
(全文结束)


