研究警告AI医疗聊天机器人误导患者Drs spend 4x more time on paperwork than patients

环球医讯 / AI与医疗健康来源:www.express.co.uk英国 - 英语2025-07-30 15:25:01 - 阅读时长4分钟 - 1604字
一项重大新研究警告使用AI聊天机器人提供医疗建议的风险,显示普通人在使用最新"医生机器人"时仍可能无法识别严重疾病或做出正确决定,尽管这些机器人本身在医学考试中得分很高。这项研究引发了对政府和科技公司推广AI医疗应用的严重担忧。
AI医疗聊天机器人医疗建议健康场景诊断患者技术与现实差距用户试验英国十年健康计划预防疾病数字工具
研究警告AI医疗聊天机器人误导患者

一项重大新研究对使用AI聊天机器人提供医疗建议的做法发出了严厉警告,研究显示普通人在使用最新"医生机器人"时仍可能无法识别严重疾病或做出正确决策,尽管这些机器人本身在医学考试中得分很高。

这项研究正值英国政府宣布在其十年计划中加大医疗AI应用之际。

在一项开创性的试验中,1,298名公众被要求处理十个常见健康场景 - 比如胸痛或腹部问题 - 使用的是领先的AI聊天机器人(如ChatGPT的GPT-4o)或传统资源如谷歌或英国国家医疗服务体系(NHS)网站。

这些机器人单独测试时表现令人印象深刻 - 正确诊断医疗状况的比例达到95%。但当真实用户使用它们寻求帮助时,结果却令人担忧。在34.5%的案例中诊断正确,而在56%的案例中,用户做出了错误的决定(如前往急诊科或留在家中)。

研究人员表示,问题不在于机器人的医学知识,而在于它们与人类互动的方式。用户经常给机器人提供不完整或模糊的信息,而机器人虽然技术上正确,但未能清楚地解释下一步该做什么。

诺丁汉特伦特大学社会科学教授罗伯特·丁沃尔表示:"这只是一个研究,但它很好地提醒我们,在技术开发者模型、模拟和想象中有效的东西很少能成功转移到现实生活中。卫生和社会保健部应该谨慎对待这些虚假的AI承诺。"

牛津大学循证医学中心主任卡尔·亨eghan教授说:"医生需要接受十年的培训才能成为顾问,培养从普通疾病中识别严重和危及生命疾病的经验和专业知识。虽然AI在解读X光片和心电图等领域有其作用,但在诊断疾病时,它无法替代全面的病史和体检。广泛推广未经测试的AI会浪费资源,并且正如这项研究所示,可能会伤害寻求诊断的患者。"

上周政府发布了为期十年的计划,将NHS从治疗疾病转向预防疾病 - 这一战略高度依赖数字工具、应用程序和AI来赋权患者。

在其本月发布的宣言中,政府表示:"该计划将使NHS进入数字时代,确保工作人员从新技术带来的优势和效率中受益...政府还将使用数字电话,确保所有拨打GP诊所的电话都能迅速得到答复。对于有需要的人,他们将在提出请求的当天获得数字或电话咨询。"

但这项研究显示了AI在实验室中的表现与其在现实世界中的使用之间的差距。作者警告说,当前的基准具有误导性,AI工具不仅要根据知识进行测试,还要根据它们与非专家沟通的能力进行测试。

"仅仅因为一个聊天机器人能够通过医生考试,并不意味着当你生病时它能帮到你,"该研究的主要负责人之一说。"这就像是给人一个听诊器就指望他们做心脏手术一样。"

研究人员表示,未来的AI工具必须更加主动 - 提出清晰、有指导性的问题并主动管理对话,而不是依赖用户知道哪些细节在医学上是重要的。

这些发现呼应了早期的研究结果,显示即使是受过训练的医生在AI帮助下也没有在诊断患者方面变得更好。现在我们知道对于普通公众也是如此。

专家呼吁在部署医疗AI之前进行严格的用户试验,尤其是在直接向患者提供建议时。否则,人们可能会误以为自己很安全,从而推迟看医生 - 或者不必要地冲向急诊科。

卫生和社会保健部发言人表示:"通过我们的十年健康计划,我们正在削减整个卫生服务机构的官僚主义,减少繁琐的行政任务,并利用技术让医生能够专注于他们最擅长的工作 - 照顾患者。这包括推广AI记录员来结束临床记录、起草信件和手动数据输入,使临床医生能够专注于治疗患者,节省的时间相当于在普通医疗实践中增加2,000名医生。"

"我们还减少了住院医生所需的重复性强制培训,并在连续第二年提供高于通胀的加薪的同时,我们一直在倾听医生的意见以改善他们的工作生活。我们还有更多工作要做,但NHS在带来小改变方面已经取得了良好进展,这些改变具有重大影响。"

【全文结束】

大健康
大健康