微软开发了一种人工智能(AI)系统,声称其在诊断复杂疾病方面的表现比医生高出四倍。
这家科技公司的AI诊断系统能够以高达86%的准确率识别疾病,而英国和美国医生的平均准确率仅为20%。微软在宣布这一发现时表示,这为“医疗超级智能”奠定了基础。
英国卫生大臣韦斯·斯特里廷(Wes Streeting)正寻求将AI技术广泛应用于英国国家医疗服务体系(NHS),以提升效率。今年4月,NHS等待名单在七个月来首次上升,达到742万人,这对政府削减等待时间的关键承诺造成了打击。
微软声称,其系统不仅能比医生更便宜地解决问题,即便在限制诊断测试预算的情况下,仍能胜过医生。
该系统被称为“微软AI诊断协调器”(Microsoft AI Diagnostic Orchestrator,简称MAI-DxO),它基于《新英格兰医学杂志》(New England Journal of Medicine)中的304个病例进行了测试。这些病例由麻省总医院(Massachusetts General Hospital)提供,以其复杂性著称。
该系统由五个不同角色的虚拟AI机器人组成,分别担任“假设生成者博士”、“测试选择者博士”和“挑战者博士”等角色。这些AI机器人会内部讨论后提出进一步问题、安排测试并给出诊断结果。
例如,在一个案例中,该系统成功诊断出一名29岁女性患有胚胎型横纹肌肉瘤(embryonal rhabdomyosarcoma),这是一种通常发生在儿童身上的罕见癌症。
当与ChatGPT开发者OpenAI开发的最先进AI模型结合使用且不限制测试预算时,该系统的诊断准确率达到85.5%。然而,即使必须遵守2000美元(约合1458英镑)的测试预算,其准确率仍超过70%。
参与测试的21名医生平均拥有12年的经验,他们在测试上平均花费2963美元。普通医生的诊断准确率仅为19.9%,但需要注意的是,他们无法查阅教科书或软件信息,且为全科医生而非专科医生。
微软表示,即使在无法进行任何测试的情况下,其AI工具仍能在超过一半的情况下正确诊断病情。
“辅助”医生
研究人员指出,《新英格兰医学杂志》提供的病例设定了付费墙,且许多病例是在AI系统训练后发布的。这确保了这些病例未包含在用于构建AI的数据集中,系统必须自行得出诊断结论。
微软的AI健康部门由穆斯塔法·苏莱曼(Mustafa Suleyman)领导,他是英国企业家,曾共同创立DeepMind实验室,后被谷歌收购。他于去年加入微软。
该公司表示,其Bing搜索引擎和Copilot聊天机器人每天接收5000万次健康相关查询,并补充道:“AI助手正在迅速成为医疗保健的新前线。”
然而,微软强调,AI将辅助而不是取代医疗专业人员。
公司表示:“医生需要在模糊情况下做出判断,并以一种AI无法做到的方式与患者及其家属建立信任。”
上周,斯特里廷先生推出了一款NHS应用程序,他表示其中将包括一个充当“口袋医生”的聊天机器人。
(全文结束)


