AI在复杂诊断中展现潜力,但其优于医生的能力可能被“夸大”AI shows promise for complex diagnoses, but superiority to physicians may be ‘exaggerated’

环球医讯 / AI与医疗健康来源:www.healio.com美国 - 英文2025-07-11 16:41:59 - 阅读时长4分钟 - 1797字
微软AI系统在复杂医疗案例诊断中表现优于医生,但专家认为直接比较并不公平,强调AI作为辅助工具的价值,并呼吁重新审视AI在医疗中的角色和评估方式。
AI复杂医疗诊断医生准确性成本效益临床实践医疗系统系统性教育补充工具健康
AI在复杂诊断中展现潜力,但其优于医生的能力可能被“夸大”

当微软AI宣布其系统在复杂医疗案例的诊断中比专家医生更准确、更具成本效益时,该公司将这一结果称为迈向“医学超级智能”的第一步。

与Healio交流的医疗领导者对这一成果表现出更为谨慎的热情。他们称赞了公司对技术的评估方式,并承认其在指导决策方面的潜力,但也强调数据仍处于初步阶段,需要严格的验证。

Lauren Bruckner(劳伦·布鲁克纳),Roswell Park Comprehensive Cancer Center(罗斯威尔公园综合癌症中心)的儿科血液肿瘤学家兼首席医学信息官表示:“他们的方法非常聪明,这确实为帮助临床医生提供了很大的希望。但目前还处于非常早期的阶段——事实上,所有AI的应用都还处于早期阶段——因此我们需要反复测试。在考虑将其应用于临床实践时必须保持谨慎。”

City of Hope(希望之城)的首席AI与分析官**Nasim Eftekhari(纳西姆·埃夫特哈里)**表示,这项研究为理解AI在现实世界中的表现提供了“一些重要的贡献”。然而,她指出,研究中对医生施加的限制意味着这些引人注目的结论必须谨慎解读。

研究人员创建了一个名为“顺序诊断基准”的测试,将《新英格兰医学杂志》(NEJM)中发布的304个复杂病例转化为逐步诊断过程。参与研究的全科医生和AI模型收到了一个简短的摘要,能够通过迭代提问或请求诊断测试来获取更多信息。随着他们获得新的见解,医生和AI模型不断调整自己的分析并给出最终诊断,这些诊断随后与NEJM中发布的最佳结果进行了比较。

每个步骤(如X光检查或血液检测)或医生访问都会产生假设成本,从而允许研究人员比较AI与人类在诊断准确性和相关实际医疗支出上的差异。

微软AI团队评估了一套生成式AI模型,包括Gemini(谷歌)、ChatGPT(OpenAI)和Grok(xAI),并评估了微软的MAI诊断协调器(MAI-DxO)的影响。该协调器旨在模拟一个由不同方法的医生组成的小组,以模拟协作临床推理,与每个模型合作确定必要的测试并提出诊断。

使用MAI-DxO协调器提高了每个单独AI模型的准确性。表现最佳的方法——MAI-DxO与OpenAI的o3模型结合——正确解决了80%的案例研究,而相比之下,来自美国和英国的21名医生的平均准确率为20%。此外,MAI-DxO的假设测试成本比专家医生或任何单一生成式AI模型低20%。

尽管如此,专家们指出,研究中对医生的限制使得直接比较AI和人类的表现“有些不公平”。例如,医生被禁止使用教科书、咨询同事或访问互联网和AI工具。这种设置虽然允许进行“公平的比较”,但并不反映日常实践。

“没有全科医生会在不与同事讨论、不使用AI或至少访问互联网的情况下,对罕见或困难的病例做出诊断,”Eftekhari说。“此外,AI经过微调以处理这些复杂的诊断,但许多初级医生可能从未遇到过这些情况。每个人都抓住‘AI的表现比医生好四倍’这一点,但我认为这是夸大的。”

专家们建议重新定义AI在医疗中的价值主张。与其比较AI与医生的表现,不如比较使用标准资源的医生与使用AI的医生。这将把辩论从“人类或算法”转向“负责任地部署的人类与算法相结合”。

Bruckner表示,AI的当前优势仅限于某些方面。“我的工作部分在于与患者及其家属建立信任关系,理解人性,并在他们可能不完全明白问题或感觉不对劲时提取信息。AI还没有达到可以做到这一点的地步。我们仍然需要能够进行同理沟通的专家临床医生。”

如果AI最终能显著提高诊断的准确性和效率,可能会引发医疗系统的“巨大范式转变”。Bruckner预测,诊断工作可能会更多地转移到全科医生领域,而专科医生可能更多地成为治疗专家而非诊断专家。

随着AI在医疗中的角色不断扩大和演变,系统性教育可能是缓解劳动力担忧的关键。根据今年ASCO年会上的一项研究,Mayo Clinic(梅奥诊所)的Guilherme Sacchi de Camargo Correia博士及其同事对员工进行了调查,结果显示大多数人欢迎AI在临床环境中的应用,但许多人对其潜在风险表示担忧,包括可能导致诊断不准确或降低护理质量。

专家们一致认为,AI将成为医生和其他医疗专业人员的补充工具,而不是取代他们。AI的发展将使优秀的医生变得更好,但它的使用需要负责任地进行。


(全文结束)

大健康
大健康