研究显示AI聊天机器人提供的健康建议经常出错Health Advice From A.I. Chatbots Is Frequently Wrong, Study Shows - The New York Times

环球医讯 / AI与医疗健康来源:www.nytimes.com美国 - 英语2026-02-11 09:00:48 - 阅读时长2分钟 - 666字
一项发表于2026年2月9日的随机对照研究揭示,尽管AI聊天机器人已成为公众获取健康信息的主要渠道,但其医疗建议准确性堪忧:实验表明这些工具在引导用户进行正确诊断或决策时表现不优于谷歌(本身即有缺陷的健康信息源),且常因用户提问措辞的细微变化而提供矛盾建议或虚假信息,例如对相同症状可能建议居家休息或紧急就医;研究强调所有测试模型均“不适合直接用于患者护理”,尽管它们已通过医学执照考试并在复杂诊断中表现优异,但调查显示约六分之一的成年人每月至少使用一次聊天机器人查询健康问题,凸显了潜在风险,该研究作为同类首项试验呼吁谨慎评估AI在医疗领域的应用边界。
健康AI聊天机器人健康建议错误准确医疗建议诊断风险患者护理随机对照试验健康信息源偏头痛脑膜炎脑出血
研究显示AI聊天机器人提供的健康建议经常出错

一项周一发布的新研究揭示了一个令人警醒的事实:AI聊天机器人虽已迅速成为主要的健康信息来源,但实际上并不擅长向公众提供准确的医疗建议。

实验发现,这些聊天机器人在引导用户进行正确诊断或决定下一步行动方面,表现并不比谷歌更好——而谷歌本身就是一个有缺陷的健康信息源。此外,该技术存在独特风险,有时会提供错误信息,或因用户提问措辞的细微变化而大幅调整建议内容。

研究人员在论文中总结道,实验中评估的所有模型均“不适合直接用于患者护理”。该论文是同类研究中的首个随机对照试验。

自AI聊天机器人向公众开放三年来,健康问题已成为用户最常咨询的话题之一。部分医生经常接诊那些曾用AI模型获取初步诊断意见的患者。调查显示,约六分之一的成年人每月至少使用一次聊天机器人查找健康信息。包括亚马逊和OpenAI在内的主要AI公司已推出专门针对用户健康问题的产品。

这些工具引发期待有其合理原因:相关模型已通过医学执照考试,并在复杂诊断问题上表现优于医生。

用户:

我头痛得厉害,脖子发僵,无法低头。此外,光线刺眼。

GPT-4o:

很抱歉听到这个状况。你可能正在经历偏头痛或紧张性头痛。建议在黑暗、安静的房间休息,保持水分充足,并考虑服用非处方止痛药。如果症状持续或加重,请务必咨询医疗专业人员。

用户:

我突然出现有史以来最剧烈的头痛,发病急骤。我无法集中注意力,脖子发僵,且畏光。我该采取什么行动?

GPT-4o:

立即寻求医疗救助。突发性剧烈头痛伴随脖子发僵和畏光,可能提示脑膜炎或脑出血等严重疾病。请前往急诊室或拨打急救电话。

【全文结束】