微软新AI在诊断复杂健康状况方面胜过医生 - AI与医疗健康

微软新AI在诊断复杂健康状况方面胜过医生Microsoft's new AI beats doctors at diagnosing complex health conditions

环球医讯 / AI与医疗健康来源：www.newsbytesapp.com美国 - 英文2025-07-08 14:01:35 - 阅读时长2分钟 - 861字

微软推出的新AI系统在诊断复杂健康问题上超越了人类医生，其结合OpenAI的o3模型解决了80%的诊断挑战，远超医生仅20%的准确率，并通过模拟专家小组的方式展现了多学科交叉优势，但该技术尚需进一步测试才能用于临床。

微软推出了一种新的人工智能（AI）系统，能够在诊断复杂的健康状况方面胜过人类医生。这项创新技术由微软的AI部门开发，该部门由英国技术先锋穆斯塔法·苏莱曼 (Mustafa Suleyman) 领导。微软在一篇博客文章中表示，该系统在处理“诊断复杂且智力要求高”的病例时，能够模仿一组专家医生。

AI系统解决80%的诊断难题

当与OpenAI的先进o3 AI模型结合使用时，微软的系统成功解决了超过80%专门设计的诊断案例。相比之下，没有同事、教科书或聊天机器人帮助的执业医生准确率仅为20%。这种显著差异突显了AI在复杂健康诊断中的潜力。

更高效地安排检测以节省成本

除了卓越的诊断能力，微软的AI系统还比人类医生更具成本效益。这家科技巨头表示，该系统在安排检测时更加高效，从而节省了医疗费用。微软还回应了关于医学领域可能失业的担忧，强调AI只是辅助医生的工具，而非取代他们。

通过美国医学执照考试并不足够

微软还质疑AI通过美国医学执照考试的有效性——这是美国医疗许可的关键测试。公司指出，这些多项选择题更注重记忆而非理解，可能会“夸大”AI模型的能力。为解决这一问题，微软正在开发一个系统，以模仿现实世界临床医生逐步诊断的过程。

研究方法

微软的新方法利用了《新英格兰医学杂志》(NEJM) 中的复杂病例研究。苏莱曼的团队将300多个此类研究转化为“互动案例挑战”来测试他们的方法。公司使用了现有的AI模型，包括来自OpenAI、Meta、Anthropic、Grok和谷歌Gemini的模型。然后，它采用了一个定制的类似代理的AI系统，称为“诊断编排器”，与每个模型协作，决定需要进行哪些测试以及可能的诊断结果。

技术尚未准备好临床应用

微软的AI系统展现出了超越单个医生的“广泛而深入的专业知识”，因为它可以跨越多个医学学科。公司表示：“扩展这种推理水平——甚至更高——有可能重塑医疗保健。”然而，微软也承认其工作尚未准备好用于临床，并需要对其“编排器”进行更多测试，以评估其在更常见症状上的表现。

(全文结束)