![Envato/monkeybusiness]
一项发表于《柳叶刀》的新研究显示,经验丰富的医生在使用人工智能辅助系统进行结直肠癌筛查后,当AI系统撤除时,他们的筛查能力反而下降。就在揭示人类能力局限性的同时,另一项突破性研究宣称OpenAI最新模型GPT-5在复杂医学推理任务中展现出"超人类"表现,远超专业医疗人员。
这两项发现提出了关键问题:AI究竟是提升医疗水平的革命性工具,还是正在使临床医生变得过度依赖并丧失专业技能?答案比想象中复杂。
研究细节
波兰研究人员跟踪了19名已完成2000+例结肠镜检查的医生,研究期间覆盖1443例无AI辅助操作:
- 使用AI前:医生癌前病变检出率为28.4%
- 使用AI后:独立操作时检出率降至22.4%
- 启用AI时:检出率为25.3%
这项研究首次实证了医疗AI导致的"去技能化"现象,研究人员将其归因为"自动化偏差"——医生在缺乏数字助手时表现出降低的工作积极性。就像长期依赖GPS导航导致城市路线认知能力下降。
AI医疗能力突破
埃默里大学医学院研究显示,GPT-5在医学考试中取得突破:
- 标准化考试:在MedQA和USMLE考试中取得95.2%-95.8%正确率
- 多模态推理:相比GPT-4o,在MedXpertQA测试中推理能力提升29%
- 临床诊断:准确诊断Boerhaave综合征(食管破裂)并制定诊疗方案
但最新研究揭示重大隐患:53项医学基准测试中,92%存在数据污染风险,94%未测试模型处理噪声数据的能力,96%未评估模型表达不确定性的能力。
矛盾再审视
三项研究共同揭示医疗AI悖论:
- 人类医生独立诊断能力下降
- AI系统宣称具备超人类表现
- 测评体系存在系统性缺陷
解决方案包括:
- 设立"无AI训练日"保持临床技能
- 建立动态临床工作流基准测试
- 重新定义AI时代医生角色
研究警示,当前测评体系可能创造"进步假象",在放弃传统医疗技能前,必须确保AI系统真正具备应对真实医疗场景的可靠性。
【全文结束】