微软AI部门推出了一项可能重塑临床医学未来的技术突破。这款名为微软AI诊断协调器(MAI-DxO)的新系统在解决复杂诊断病例方面表现出卓越的能力,其准确性和成本效益均达到或超过了经验丰富的医生水平。
在针对《新英格兰医学杂志》(NEJM)发布的304个真实患者病例的测试中,该AI系统成功诊断了高达85.5%的病例。相比之下,来自美国和英国的21名拥有5至20年经验的医生群体仅达到了20%的成功率。此外,MAI-DxO还在模拟诊断测试中表现出更高效的资源使用,运行成本更低。
微软指出:“这些病例是临床医学中最具有诊断复杂性和智力挑战性的案例之一。”强调了这一成就的里程碑意义。
该AI系统通过微软称之为“顺序诊断基准”(SD Bench)的方式运作,模拟了临床医生在现实生活中调查病例的过程。系统在每一步中提出问题、安排检测,并根据结果更新其推理,直到得出最终诊断。
MAI-DxO并非依赖单一模型,而是作为一个协调器,整合多个AI模型,如同一个虚拟的临床医生团队。这种“协调”机制允许分层推理和更高的适应性,尤其是在高风险情境下。最佳效果来自MAI-DxO与OpenAI的o3模型配对使用。
为了确保评估的真实性,每一步诊断都会产生虚拟成本,模拟实际医疗费用。这一框架使研究人员能够同时评估诊断成功率和经济效率。
关键在于,该系统并非简单地安排所有可用检测。它被配置为做出有意识的、注重成本的决策,反映出真实世界医疗实践中的限制条件。微软表示,AI工具不仅做出了更优决策,而且相比人类医生或单一AI模型,使用了更少的资源。
除了诊断领域,微软还在整个医疗保健领域进行开发。其他工具包括Dragon Copilot——一款面向临床医生的语音优先AI助手,以及RAD-DINO——一款简化放射科工作流程的工具。
研究团队也承认该系统目前仍存在局限性。尽管MAI-DxO在高复杂度诊断中表现出色,但其在更常见、日常患者案例中的表现仍需进一步研究。此外,在大规模部署之前,还需要在临床环境中进行实地测试。
目前,微软正与领先的医疗机构合作,以在真实临床条件下对该系统进行严格评估。微软强调,负责任的治理和监管框架对于确保该技术安全有效地部署至关重要。
研究团队表示:“随着进一步的发展,AI有望帮助患者自我管理常规护理,并为医生提供强大的工具来应对复杂病例。我们坚信,医疗的未来在于将人类专业知识与机器智能相结合。”
【全文结束】


