微软的AI在疾病诊断上胜过医生Microsoft’s AI Is Better Than Doctors at Diagnosing Disease

环球医讯 / AI与医疗健康来源:time.com美国 - 英文2025-07-11 14:45:48 - 阅读时长5分钟 - 2076字
微软的一项研究表明,其基于AI的医疗程序MAI - DxO在诊断疾病方面的准确率高达85%,远超人类医生的20%,并且成本更低,这一成果可能改变全球医疗诊断方式并提高患者治疗效果。
微软AI疾病诊断医疗保健MAI-DxO诊断准确率医疗成本AI优势谷歌医疗系统临床试验患者健康
微软的AI在疾病诊断上胜过医生

医学或许是艺术与科学的结合体,但微软刚刚证明了这其中的大部分内容可以被一个机器人所学习。

微软公司在预印本网站arXiv上发布的一项研究中报告称,其基于AI的医疗程序——微软AI诊断协调器(MAI - DxO),正确诊断了《新英格兰医学杂志》中描述的85%的病例。这比人类医生的准确率高出四倍,人类医生的正确诊断率约为20%。

这些病例是该期刊每周系列的一部分,旨在难倒医生:复杂且具有挑战性的场景,其中诊断并不明显。微软选取了约300个这样的病例,并将其MAI - DxO的表现与美国和英国的21名全科医生进行了比较。为了模仿医生通常处理此类病例的迭代方式——通过收集信息、分析、订购测试,然后根据结果做出决策——微软团队为每个案例创建了一个逐步决策的基准流程。这使得医生和AI系统都能够提问并就下一步行动(例如订购测试)做出决定,类似于决策流程图,后续的问题和行动基于从先前步骤中获得的信息。

这21名医生与一组现成的AI模型进行了比较,这些模型包括Claude、DeepSeek、Gemini、GPT、Grok和Llama。为了进一步模拟人类医生处理这些棘手病例的方式,微软团队还构建了一个协调器:一种虚拟仿真,模拟医生在复杂病例中经常寻求的同事和会诊建议。

在现实世界中,订购医疗测试需要花费金钱,因此微软跟踪了AI系统和人类医生订购的测试,以查看哪种方法能够更便宜地完成诊断。

不仅MAI - DxO在得出正确诊断方面远远超过了医生,而且AI机器人的平均成本还低了20%。

“准确率的四倍提升比以前的研究显示的要多,”斯克里普斯转化医学研究所主任兼创始人埃里克·托普尔博士说道,他为该项目提供了见解。“大多数时候有10%的绝对百分比差异,所以这是一个非常大的飞跃。”但真正引起他注意的是成本。“AI不仅更加精确,而且费用大大降低,”他说。

MAI - DxO仍在开发中,尚未在研究之外使用。但将这样的模型纳入医学可能会减少医疗错误,从而降低医疗保健成本,并提高人类医生的效率——这反过来又可能导致患者更好的治疗结果。

“这是一个惊人的结果,”微软AI首席执行官穆斯塔法·苏莱曼说。“我认为它为我们提供了一条清晰的路径,使世界上每个人都能以难以置信的实惠价格获得最好的专家诊断。”

十年前,当AI算法首次应用于医学时,它们专注于二元任务,苏莱曼说,例如扫描图像以检测肿瘤。“如今,这些模型正在进行高质量的流畅对话,提出正确的问题并在正确的方向进行探究,在适当的时间建议适当的测试和干预措施,”他说。

AI系统的另一个优势在于它不受许多人类经验中固有的偏见的影响。“我们都有确认偏误,”微软AI副总裁多米尼克·金博士说。“有时临床医生会看到某些东西并认为,‘我确定这就像上周我见过的那个病人。’但AI的思维方式略有不同。”

MAI - DxO不仅仅给出答案。它展示了它的推理过程,以便医生可以研究和审查其推理过程。“人类临床医生可以实时监督,”苏莱曼说。“这是我们之前从未见过的对思维过程的透明度和可见性。”这反过来可以改善医生接受的教育和培训,从而进一步提高诊断准确性并最终改善患者的治疗效果。

然而,一些AI和医学领域的专家指出,微软的方法并不是完全新颖的,因为其诊断依赖于多个AI模型的综合表现。“在我看来,他们并没有测试任何针对医疗优化的单个模型,”麻省总医院和布里格姆妇女医院临床数据科学中心首席数据科学官基思·德雷尔说。“他们正在测试今天所有模型的概念并将它们的决策结合起来。这部分对我来说并不令人惊讶。”

德雷尔还指出,这些结果并不一定意味着这些系统更接近于被监管机构(如美国食品药品监督管理局)批准,后者仍未对这些系统是否属于医疗器械作出裁定。

微软并不是唯一一家追求基于AI的医疗程序来诊断疾病的公司。谷歌正在开发一种基于对话的系统,模拟医生与患者之间的互动,模仿人类医生在收集患者信息并解释症状以得出诊断的过程。在早期测试中,该系统在准确诊断模拟患者病例研究方面超过了医生。在2024年的一次类似微软所做的测试中,谷歌系统的早期版本准确诊断了59%的病例,而人类医生的准确率为33%。

然而,真正的考验将是看这些AI系统在实际医疗系统中的表现。这是理解AI如何补充或辅助医生诊断疾病角色的下一步。“他们所做的令人印象深刻,”托普尔说。“但在他们将其应用到真正的医疗高速公路之前,它不会改变医疗实践。”

托普尔希望AI系统能够在不同的医疗系统中进行测试,医生和AI平台可以在更多典型病例上进行比较。这将需要进行全面的临床试验,并获得监管机构的批准,以确保患者不会因更多依赖基于AI的决策而在治疗过程中受到伤害。“我们非常致力于创造支持临床医生和患者改善健康的证据基础,”金说。

如果得到证实,这些结果可能为在目前无法获得主要学术机构或尖端医疗保健的世界部分地区引入高质量的医疗专业知识奠定基础。“在未来五到十年内,我的主要目标是确保世界上的每个人都能获得各种最佳的医疗建议,”苏莱曼说。“对此我们感到非常兴奋。”


(全文结束)

大健康
大健康