微软推出了一种新的人工智能(AI)系统,能够在诊断复杂的健康状况方面胜过人类医生。这项创新技术由微软的AI部门开发,该部门由英国技术先锋穆斯塔法·苏莱曼 (Mustafa Suleyman) 领导。微软在一篇博客文章中表示,该系统在处理“诊断复杂且智力要求高”的病例时,能够模仿一组专家医生。
AI系统解决80%的诊断难题
当与OpenAI的先进o3 AI模型结合使用时,微软的系统成功解决了超过80%专门设计的诊断案例。相比之下,没有同事、教科书或聊天机器人帮助的执业医生准确率仅为20%。这种显著差异突显了AI在复杂健康诊断中的潜力。
更高效地安排检测以节省成本
除了卓越的诊断能力,微软的AI系统还比人类医生更具成本效益。这家科技巨头表示,该系统在安排检测时更加高效,从而节省了医疗费用。微软还回应了关于医学领域可能失业的担忧,强调AI只是辅助医生的工具,而非取代他们。
通过美国医学执照考试并不足够
微软还质疑AI通过美国医学执照考试的有效性——这是美国医疗许可的关键测试。公司指出,这些多项选择题更注重记忆而非理解,可能会“夸大”AI模型的能力。为解决这一问题,微软正在开发一个系统,以模仿现实世界临床医生逐步诊断的过程。
研究方法
微软的新方法利用了《新英格兰医学杂志》(NEJM) 中的复杂病例研究。苏莱曼的团队将300多个此类研究转化为“互动案例挑战”来测试他们的方法。公司使用了现有的AI模型,包括来自OpenAI、Meta、Anthropic、Grok和谷歌Gemini的模型。然后,它采用了一个定制的类似代理的AI系统,称为“诊断编排器”,与每个模型协作,决定需要进行哪些测试以及可能的诊断结果。
技术尚未准备好临床应用
微软的AI系统展现出了超越单个医生的“广泛而深入的专业知识”,因为它可以跨越多个医学学科。公司表示:“扩展这种推理水平——甚至更高——有可能重塑医疗保健。”然而,微软也承认其工作尚未准备好用于临床,并需要对其“编排器”进行更多测试,以评估其在更常见症状上的表现。
(全文结束)


