AI在复杂诊断中展现潜力，但其优于医生的能力可能被“夸大” - AI与医疗健康

AI在复杂诊断中展现潜力，但其优于医生的能力可能被“夸大”AI shows promise for complex diagnoses, but superiority to physicians may be ‘exaggerated’

环球医讯 / AI与医疗健康来源：www.healio.com美国 - 英文2025-07-11 16:41:59 - 阅读时长4分钟 - 1797字

微软AI系统在复杂医疗案例诊断中表现优于医生，但专家认为直接比较并不公平，强调AI作为辅助工具的价值，并呼吁重新审视AI在医疗中的角色和评估方式。

当微软AI宣布其系统在复杂医疗案例的诊断中比专家医生更准确、更具成本效益时，该公司将这一结果称为迈向“医学超级智能”的第一步。

与Healio交流的医疗领导者对这一成果表现出更为谨慎的热情。他们称赞了公司对技术的评估方式，并承认其在指导决策方面的潜力，但也强调数据仍处于初步阶段，需要严格的验证。

Lauren Bruckner（劳伦·布鲁克纳），Roswell Park Comprehensive Cancer Center（罗斯威尔公园综合癌症中心）的儿科血液肿瘤学家兼首席医学信息官表示：“他们的方法非常聪明，这确实为帮助临床医生提供了很大的希望。但目前还处于非常早期的阶段——事实上，所有AI的应用都还处于早期阶段——因此我们需要反复测试。在考虑将其应用于临床实践时必须保持谨慎。”

City of Hope（希望之城）的首席AI与分析官**Nasim Eftekhari（纳西姆·埃夫特哈里）**表示，这项研究为理解AI在现实世界中的表现提供了“一些重要的贡献”。然而，她指出，研究中对医生施加的限制意味着这些引人注目的结论必须谨慎解读。

研究人员创建了一个名为“顺序诊断基准”的测试，将《新英格兰医学杂志》（NEJM）中发布的304个复杂病例转化为逐步诊断过程。参与研究的全科医生和AI模型收到了一个简短的摘要，能够通过迭代提问或请求诊断测试来获取更多信息。随着他们获得新的见解，医生和AI模型不断调整自己的分析并给出最终诊断，这些诊断随后与NEJM中发布的最佳结果进行了比较。

每个步骤（如X光检查或血液检测）或医生访问都会产生假设成本，从而允许研究人员比较AI与人类在诊断准确性和相关实际医疗支出上的差异。

微软AI团队评估了一套生成式AI模型，包括Gemini（谷歌）、ChatGPT（OpenAI）和Grok（xAI），并评估了微软的MAI诊断协调器（MAI-DxO）的影响。该协调器旨在模拟一个由不同方法的医生组成的小组，以模拟协作临床推理，与每个模型合作确定必要的测试并提出诊断。

使用MAI-DxO协调器提高了每个单独AI模型的准确性。表现最佳的方法——MAI-DxO与OpenAI的o3模型结合——正确解决了80%的案例研究，而相比之下，来自美国和英国的21名医生的平均准确率为20%。此外，MAI-DxO的假设测试成本比专家医生或任何单一生成式AI模型低20%。

尽管如此，专家们指出，研究中对医生的限制使得直接比较AI和人类的表现“有些不公平”。例如，医生被禁止使用教科书、咨询同事或访问互联网和AI工具。这种设置虽然允许进行“公平的比较”，但并不反映日常实践。

“没有全科医生会在不与同事讨论、不使用AI或至少访问互联网的情况下，对罕见或困难的病例做出诊断，”Eftekhari说。“此外，AI经过微调以处理这些复杂的诊断，但许多初级医生可能从未遇到过这些情况。每个人都抓住‘AI的表现比医生好四倍’这一点，但我认为这是夸大的。”

专家们建议重新定义AI在医疗中的价值主张。与其比较AI与医生的表现，不如比较使用标准资源的医生与使用AI的医生。这将把辩论从“人类或算法”转向“负责任地部署的人类与算法相结合”。

Bruckner表示，AI的当前优势仅限于某些方面。“我的工作部分在于与患者及其家属建立信任关系，理解人性，并在他们可能不完全明白问题或感觉不对劲时提取信息。AI还没有达到可以做到这一点的地步。我们仍然需要能够进行同理沟通的专家临床医生。”

如果AI最终能显著提高诊断的准确性和效率，可能会引发医疗系统的“巨大范式转变”。Bruckner预测，诊断工作可能会更多地转移到全科医生领域，而专科医生可能更多地成为治疗专家而非诊断专家。

随着AI在医疗中的角色不断扩大和演变，系统性教育可能是缓解劳动力担忧的关键。根据今年ASCO年会上的一项研究，Mayo Clinic（梅奥诊所）的Guilherme Sacchi de Camargo Correia博士及其同事对员工进行了调查，结果显示大多数人欢迎AI在临床环境中的应用，但许多人对其潜在风险表示担忧，包括可能导致诊断不准确或降低护理质量。

专家们一致认为，AI将成为医生和其他医疗专业人员的补充工具，而不是取代他们。AI的发展将使优秀的医生变得更好，但它的使用需要负责任地进行。

(全文结束)