总体而言,医生们是一群相当聪明的人,但他们可能对改变持抗拒态度。最著名的例子可能是19世纪的外科医生拒绝在从太平间到产房之间洗手,从而传播了尚未被发现的微生物,导致婴儿死亡。匈牙利医师伊格纳兹·塞麦尔韦斯(Ignaz Semmelweis)收集统计数据证明肥皂和水可以挽救生命,但他却被嘲笑和孤立。
如今,我们生活在更加开明的时代,医疗实践通常有证据支持——但我们是否总是在获取正确的证据来推动变革呢?例如,将人工智能引入临床使用似乎也能挽救生命。正如我们在“AI帮助放射科医生在实际测试中发现乳腺癌”一文中报道的那样,选择使用图像分类AI辅助检测乳腺癌的放射科医生,在每筛查1000人时能多发现一个病例。在医疗系统中,这种效果可能是巨大的。
这是否意味着我们应该鼓励医生放下手术服,让机器接手一切呢?远非如此。虽然像ChatGPT这样的大型语言模型AI系统可以在多项选择的医学测试中表现出色,但在对话式诊断方面表现较差(参见“AI聊天机器人无法通过对话正确诊断患者”)。目前,一位具有良好床边风度和倾听耳朵的医生仍然是至关重要的。
相反,我们可以从这些研究中得出两个结论。首先是应该谨慎使用通用术语“人工智能”。尽管我们报道的两个系统都基于底层神经网络技术,但图像分类与文本生成是完全不同的任务,后者存在更高的风险,即AI可能会输出看似合理但实际上错误的结果。换句话说,并非所有AI都是平等的。
第二个结论是我们应该更大胆地在现实环境中测试医疗AI系统,而不仅仅是实验室或模拟环境中。乳腺癌研究通过给予放射科医生控制何时使用AI的权利,表明它可以成为有用的工具。如果我们能推动更多类似的证据出现,就像塞麦尔韦斯之后的情况一样,生命可以得到挽救,而现在他被认为是一位医学英雄。
(全文结束)


