微软推出AI医疗工具,诊断复杂疾病的表现比人类医生高出4倍Microsoft just unveiled an AI medical tool claiming it performs 4x better than human doctors at diagnosing complex ailments 😳 Meet MAI-DxO, Microsoft's new AI-powered medical tool. It was tested on 304 real cases from the New England Journal of Medicine.

环球医讯 / AI与医疗健康来源:www.linkedin.com美国 - 英文2025-07-10 10:18:00 - 阅读时长2分钟 - 846字
微软发布了一款名为MAI-DxO的全新AI医疗工具,声称其在诊断复杂疾病方面的表现比人类医生高出4倍,但同时也引发了关于AI公平性、测试条件以及未来医生角色的讨论。
AI医疗工具MAI-DxO复杂疾病诊断诊断准确率FDA批准医生角色AI潜力鲁棒性因果推理负责任使用
微软推出AI医疗工具,诊断复杂疾病的表现比人类医生高出4倍

微软刚刚发布了一款名为MAI-DxO的全新AI医疗工具,声称其在诊断复杂疾病方面的表现比人类医生高出4倍。这款AI工具基于一种“编排器”设计,结合了OpenAI的o3、xAI的Grok和Meta的Llama等模型,能够像真实医生一样进行诊断、提问、安排检测并权衡费用,且速度更快、成本更低、准确性更高。

根据测试,MAI-DxO在来自《新英格兰医学杂志》的304个真实案例中表现优异。人类医生的诊断准确率为20%,而AI则达到了85.5%。微软表示,该工具将诊断成本降低了20%,并且可能很快获得FDA批准,用于开具治疗方案。然而,事情并非没有争议——测试中,医生被禁止使用谷歌、书籍或向同事求助,批评者认为这为AI提供了不公平的优势。此外,该系统尚未在诊所实际部署。

尽管如此,AI在医疗领域的潜力显而易见。未来的医生可能不仅仅是辅助工具,而是直接取代人类医生的角色。这就引出了一个关键问题:当生命攸关时,你会选择信任AI还是人类医生?

值得一提的是,Haydar Jawad对这项研究提出了质疑。他指出,该论文存在诸多不一致之处,主要目的是通过基准测试,而非展示真正的理解能力。他认为,最大的缺陷在于未测试MAI-DxO在面对虚假或虚构临床条件时的鲁棒性。例如,若输入不存在的症状、伪造的实验室数据或虚构的疾病名称,AI是否会“幻觉”出诊断结果?这一问题揭示了系统可能只是高级相关性引擎,而非真正具备因果推理能力。

其他评论者也表达了不同的观点。有人认为护士受AI影响较小,而医生的角色确实面临风险;还有人强调,AI在某些任务中表现出“超人”能力,但在其他情况下却显得极其愚蠢甚至产生幻觉。因此,必须负责任地使用AI,并仔细核查所有结果。

无论如何,AI正在从起草邮件的简单任务迈向超越医生的复杂领域。欧洲的Greater Zurich地区已成为AI发展的中心,汇聚了OpenAI、Anthropic、谷歌、NVIDIA等公司的欧洲总部,进一步推动了AI技术的应用与创新。


(全文结束)

大健康
大健康