医生使用AI助手后癌症筛查能力下降Doctors Got Worse at Cancer Screening After Using AI Helpers

AI与医疗健康 / 来源:www.eweek.com美国 - 英语2025-08-27 02:01:46 - 阅读时长2分钟 - 891字
波兰研究显示,19名经验丰富的医生在使用AI辅助系统后,独立进行结肠镜检查的癌前病变检出率下降6个百分点。与此同时,GPT-5在医学考试中以29%优势超越人类专家,但最新研究揭示当前医学AI评估体系存在严重缺陷,约92%基准测试数据存在污染,96%未评估模型表达不确定性的能力,这引发关于人类医生技能退化与AI评估标准失真的医疗AI悖论。
癌症筛查医疗AI去技能化GPT-5临床诊断测评体系医疗水平医生技能真实医疗场景可靠性
医生使用AI助手后癌症筛查能力下降

![Envato/monkeybusiness]

一项发表于《柳叶刀》的新研究显示,经验丰富的医生在使用人工智能辅助系统进行结直肠癌筛查后,当AI系统撤除时,他们的筛查能力反而下降。就在揭示人类能力局限性的同时,另一项突破性研究宣称OpenAI最新模型GPT-5在复杂医学推理任务中展现出"超人类"表现,远超专业医疗人员。

这两项发现提出了关键问题:AI究竟是提升医疗水平的革命性工具,还是正在使临床医生变得过度依赖并丧失专业技能?答案比想象中复杂。

研究细节

波兰研究人员跟踪了19名已完成2000+例结肠镜检查的医生,研究期间覆盖1443例无AI辅助操作:

  • 使用AI前:医生癌前病变检出率为28.4%
  • 使用AI后:独立操作时检出率降至22.4%
  • 启用AI时:检出率为25.3%

这项研究首次实证了医疗AI导致的"去技能化"现象,研究人员将其归因为"自动化偏差"——医生在缺乏数字助手时表现出降低的工作积极性。就像长期依赖GPS导航导致城市路线认知能力下降。

AI医疗能力突破

埃默里大学医学院研究显示,GPT-5在医学考试中取得突破:

  • 标准化考试:在MedQA和USMLE考试中取得95.2%-95.8%正确率
  • 多模态推理:相比GPT-4o,在MedXpertQA测试中推理能力提升29%
  • 临床诊断:准确诊断Boerhaave综合征(食管破裂)并制定诊疗方案

但最新研究揭示重大隐患:53项医学基准测试中,92%存在数据污染风险,94%未测试模型处理噪声数据的能力,96%未评估模型表达不确定性的能力。

矛盾再审视

三项研究共同揭示医疗AI悖论:

  1. 人类医生独立诊断能力下降
  2. AI系统宣称具备超人类表现
  3. 测评体系存在系统性缺陷

解决方案包括:

  • 设立"无AI训练日"保持临床技能
  • 建立动态临床工作流基准测试
  • 重新定义AI时代医生角色

研究警示,当前测评体系可能创造"进步假象",在放弃传统医疗技能前,必须确保AI系统真正具备应对真实医疗场景的可靠性。

【全文结束】