微软AI诊断系统在复杂病例上的表现比医生高出四倍 - AI与医疗健康

微软AI诊断系统在复杂病例上的表现比医生高出四倍Microsoft’s AI diagnostic system outperforms doctors 4x on complex cases

环球医讯 / AI与医疗健康来源：getcoai.com美国 - 英文2025-07-10 12:21:00 - 阅读时长3分钟 - 1153字

微软开发的AI诊断系统MAI-DxO在复杂病例诊断中准确率达到85%，远超人类医生的20%。该系统通过模拟多位医生协作的方式进行诊断，不仅能提高诊断精度，还能有效控制医疗成本，标志着AI在医疗领域的重大突破。

微软的AI诊断协调器（MAI-DxO）在《新英格兰医学杂志》提供的复杂病例诊断中达到了85%的准确率，比测试中人类医生平均20%的准确率高出四倍以上。该系统展示了AI如何通过提高诊断精度和降低成本来增强医疗保健，尽管微软强调其设计目的是辅助而非取代医生。

工作原理：MAI-DxO将大型语言模型转化为一个协作诊断系统，模拟真实的临床推理过程。

该系统与多个先进AI模型协作，包括GPT、Llama、Claude、Gemini、Grok和DeepSeek，形成了微软描述为“拥有不同诊断方法的虚拟医生团队合作解决诊断案例”的机制。
与传统的依靠记忆选择题答案的AI医疗基准不同，MAI-DxO使用了微软的顺序诊断基准（SD Bench），遵循真实临床医生使用的逐步诊断过程。
系统在生成诊断时会展示其推理过程，请求测试并跟踪成本，呈现出一种人类医生熟悉的诊断流程。

关键性能指标：AI系统在显著超越人类医生的同时保持了成本效率。

成本管理功能：系统内置了财务护栏以应对医疗保健中的定价挑战。

更大的医疗背景：微软的这一发布正值AI逐渐渗透到整个医疗行业的应用之中。

微软报告称，其AI消费产品（如Bing和Copilot）每天处理超过5000万次与健康相关的会话。
“从第一次膝盖疼痛查询到深夜寻找急诊诊所，搜索引擎和AI助手正迅速成为医疗保健的新前线”，微软表示。
MAI-DxO是微软去年启动的“专注消费者健康努力”的一部分，其他医疗AI工具还包括用于放射学工作流的RAD-DINO和用于语音协助的Microsoft Dragon Copilot。

各方评价：微软承认了AI在医疗领域的潜力与局限性。

(全文结束)