微软推出AI医疗工具，诊断复杂疾病的表现比人类医生高出4倍 - AI与医疗健康

微软推出AI医疗工具，诊断复杂疾病的表现比人类医生高出4倍Microsoft just unveiled an AI medical tool claiming it performs 4x better than human doctors at diagnosing complex ailments 😳 Meet MAI-DxO, Microsoft's new AI-powered medical tool. It was tested on 304 real cases from the New England Journal of Medicine.

环球医讯 / AI与医疗健康来源：www.linkedin.com美国 - 英文2025-07-10 10:18:00 - 阅读时长2分钟 - 846字

微软发布了一款名为MAI-DxO的全新AI医疗工具，声称其在诊断复杂疾病方面的表现比人类医生高出4倍，但同时也引发了关于AI公平性、测试条件以及未来医生角色的讨论。

微软刚刚发布了一款名为MAI-DxO的全新AI医疗工具，声称其在诊断复杂疾病方面的表现比人类医生高出4倍。这款AI工具基于一种“编排器”设计，结合了OpenAI的o3、xAI的Grok和Meta的Llama等模型，能够像真实医生一样进行诊断、提问、安排检测并权衡费用，且速度更快、成本更低、准确性更高。

根据测试，MAI-DxO在来自《新英格兰医学杂志》的304个真实案例中表现优异。人类医生的诊断准确率为20%，而AI则达到了85.5%。微软表示，该工具将诊断成本降低了20%，并且可能很快获得FDA批准，用于开具治疗方案。然而，事情并非没有争议——测试中，医生被禁止使用谷歌、书籍或向同事求助，批评者认为这为AI提供了不公平的优势。此外，该系统尚未在诊所实际部署。

尽管如此，AI在医疗领域的潜力显而易见。未来的医生可能不仅仅是辅助工具，而是直接取代人类医生的角色。这就引出了一个关键问题：当生命攸关时，你会选择信任AI还是人类医生？

值得一提的是，Haydar Jawad对这项研究提出了质疑。他指出，该论文存在诸多不一致之处，主要目的是通过基准测试，而非展示真正的理解能力。他认为，最大的缺陷在于未测试MAI-DxO在面对虚假或虚构临床条件时的鲁棒性。例如，若输入不存在的症状、伪造的实验室数据或虚构的疾病名称，AI是否会“幻觉”出诊断结果？这一问题揭示了系统可能只是高级相关性引擎，而非真正具备因果推理能力。

其他评论者也表达了不同的观点。有人认为护士受AI影响较小，而医生的角色确实面临风险；还有人强调，AI在某些任务中表现出“超人”能力，但在其他情况下却显得极其愚蠢甚至产生幻觉。因此，必须负责任地使用AI，并仔细核查所有结果。

无论如何，AI正在从起草邮件的简单任务迈向超越医生的复杂领域。欧洲的Greater Zurich地区已成为AI发展的中心，汇聚了OpenAI、Anthropic、谷歌、NVIDIA等公司的欧洲总部，进一步推动了AI技术的应用与创新。

(全文结束)