研究警告AI医疗聊天机器人误导患者 - AI与医疗健康

研究警告AI医疗聊天机器人误导患者Drs spend 4x more time on paperwork than patients

环球医讯 / AI与医疗健康来源：www.express.co.uk英国 - 英语2025-07-30 15:25:01 - 阅读时长4分钟 - 1604字

一项重大新研究警告使用AI聊天机器人提供医疗建议的风险，显示普通人在使用最新"医生机器人"时仍可能无法识别严重疾病或做出正确决定，尽管这些机器人本身在医学考试中得分很高。这项研究引发了对政府和科技公司推广AI医疗应用的严重担忧。

一项重大新研究对使用AI聊天机器人提供医疗建议的做法发出了严厉警告，研究显示普通人在使用最新"医生机器人"时仍可能无法识别严重疾病或做出正确决策，尽管这些机器人本身在医学考试中得分很高。

这项研究正值英国政府宣布在其十年计划中加大医疗AI应用之际。

在一项开创性的试验中，1,298名公众被要求处理十个常见健康场景 - 比如胸痛或腹部问题 - 使用的是领先的AI聊天机器人（如ChatGPT的GPT-4o）或传统资源如谷歌或英国国家医疗服务体系（NHS）网站。

这些机器人单独测试时表现令人印象深刻 - 正确诊断医疗状况的比例达到95%。但当真实用户使用它们寻求帮助时，结果却令人担忧。在34.5%的案例中诊断正确，而在56%的案例中，用户做出了错误的决定（如前往急诊科或留在家中）。

研究人员表示，问题不在于机器人的医学知识，而在于它们与人类互动的方式。用户经常给机器人提供不完整或模糊的信息，而机器人虽然技术上正确，但未能清楚地解释下一步该做什么。

诺丁汉特伦特大学社会科学教授罗伯特·丁沃尔表示："这只是一个研究，但它很好地提醒我们，在技术开发者模型、模拟和想象中有效的东西很少能成功转移到现实生活中。卫生和社会保健部应该谨慎对待这些虚假的AI承诺。"

牛津大学循证医学中心主任卡尔·亨eghan教授说："医生需要接受十年的培训才能成为顾问，培养从普通疾病中识别严重和危及生命疾病的经验和专业知识。虽然AI在解读X光片和心电图等领域有其作用，但在诊断疾病时，它无法替代全面的病史和体检。广泛推广未经测试的AI会浪费资源，并且正如这项研究所示，可能会伤害寻求诊断的患者。"

上周政府发布了为期十年的计划，将NHS从治疗疾病转向预防疾病 - 这一战略高度依赖数字工具、应用程序和AI来赋权患者。

在其本月发布的宣言中，政府表示："该计划将使NHS进入数字时代，确保工作人员从新技术带来的优势和效率中受益...政府还将使用数字电话，确保所有拨打GP诊所的电话都能迅速得到答复。对于有需要的人，他们将在提出请求的当天获得数字或电话咨询。"

但这项研究显示了AI在实验室中的表现与其在现实世界中的使用之间的差距。作者警告说，当前的基准具有误导性，AI工具不仅要根据知识进行测试，还要根据它们与非专家沟通的能力进行测试。

"仅仅因为一个聊天机器人能够通过医生考试，并不意味着当你生病时它能帮到你，"该研究的主要负责人之一说。"这就像是给人一个听诊器就指望他们做心脏手术一样。"

研究人员表示，未来的AI工具必须更加主动 - 提出清晰、有指导性的问题并主动管理对话，而不是依赖用户知道哪些细节在医学上是重要的。

这些发现呼应了早期的研究结果，显示即使是受过训练的医生在AI帮助下也没有在诊断患者方面变得更好。现在我们知道对于普通公众也是如此。

专家呼吁在部署医疗AI之前进行严格的用户试验，尤其是在直接向患者提供建议时。否则，人们可能会误以为自己很安全，从而推迟看医生 - 或者不必要地冲向急诊科。

卫生和社会保健部发言人表示："通过我们的十年健康计划，我们正在削减整个卫生服务机构的官僚主义，减少繁琐的行政任务，并利用技术让医生能够专注于他们最擅长的工作 - 照顾患者。这包括推广AI记录员来结束临床记录、起草信件和手动数据输入，使临床医生能够专注于治疗患者，节省的时间相当于在普通医疗实践中增加2,000名医生。"

"我们还减少了住院医生所需的重复性强制培训，并在连续第二年提供高于通胀的加薪的同时，我们一直在倾听医生的意见以改善他们的工作生活。我们还有更多工作要做，但NHS在带来小改变方面已经取得了良好进展，这些改变具有重大影响。"

【全文结束】