微软对其正在开发的人工智能(AI)医疗诊断工具提出了大胆的主张。该公司声称,该工具比一组经验丰富的医生诊断准确性高出四倍,并且能够“解决医学中最复杂的诊断难题”。
具体来说,微软的AI诊断协调器——简称MAI-DxO——能够正确诊断《新英格兰医学杂志》(NEJM)上发布的85%的复杂病例。
相比之下,当微软要求来自美国和英国的21名执业医生查看相同的病例并提供诊断时,这些人类医生的准确率仅为20%。
在一段演示视频中,微软展示了MAI-DxO如何能够安排医疗测试并提供每项测试的预估费用。随后,它还能评估测试结果,即使诊断涉及极其罕见的疾病,也能得出正确的结论。
微软表示:“我们的MAI-DxO协调器能够以更高的准确性和更低的成本处理一些世界上最棘手的诊断问题。这让我们走上了通往‘医疗超级智能’的道路——这是迈向更好、更普及医疗服务的重要一步。”
该公司表示,他们开始在美国医师执照考试(USMLE)中测试其医疗AI诊断系统,而这正是医生们在美国行医所必须通过的考试。这项测试是对临床知识和决策能力的标准化评估。
然而,由于这是一个标准化测试,对AI而言过于简单。微软表示,其协调器仅用三年时间就取得了接近完美的分数。
“这些测试主要依赖于多项选择题,这更偏向记忆而非深度理解。”公司指出,“通过将医学简化为多项选择题的一次性答案,这样的基准夸大了AI系统的表面能力,掩盖了它们的局限性。”
为了使评估更具挑战性,微软让其AI分析发表在《新英格兰医学杂志》上的真实病例。
MAI-DxO被配置为在不同的成本约束下运行——就像现实生活中,患者的治疗可能由其医疗保险类型决定一样(或没有保险)。这是一个重要的特性,因为如果没有财务限制,协调器可能会默认订购所有可能的测试,而不考虑成本、治疗延误或患者的不适。
研究还发现,与医生或其他测试模型相比,MAI-DxO不仅诊断准确性更高,整体成本也更低。
“AI [可以]减少不必要的医疗支出,”公司表示。“这种推理方式有潜力重塑医疗保健。”
微软还提到了许多患有复杂健康问题的患者已经知道的事实:医疗系统往往过于依赖孤立的专科医生。这是公司认为AI可以改善患者护理的另一个领域。
全科医生治疗各种各样的病症,而专科医生则专注于某一特定领域的专业知识,希望AI能够从两者中提取医疗知识。
尽管MAI-DxO似乎擅长解决最复杂的诊断难题,但微软表示,还需要进一步测试来评估其在更常见、日常健康状况中的表现。
他们还承认,在研究中,临床医生在没有同事、教科书甚至AI帮助的情况下工作——这些都是他们在日常临床实践中可能拥有的工具。这样做是为了实现与原始人类表现的公平比较,但也意味着目前尚不清楚AI在实际医生中的竞争力究竟如何。
MAI-DxO尚未可供商业使用。微软表示,他们需要进行更多测试,以评估其可靠性、安全性和有效性。这可能需要大约十年时间。
“很明显,未来五到十年内,这些系统几乎可以做到无错误。这对世界各地的所有医疗系统来说,将是一个巨大的解脱,”微软AI首席执行官穆斯塔法·苏莱曼 (Mustafa Suleyman) 告诉《卫报》。
(全文结束)


