一项周一发布的新研究揭示了一个令人警醒的事实:AI聊天机器人虽已迅速成为主要的健康信息来源,但实际上并不擅长向公众提供准确的医疗建议。
实验发现,这些聊天机器人在引导用户进行正确诊断或决定下一步行动方面,表现并不比谷歌更好——而谷歌本身就是一个有缺陷的健康信息源。此外,该技术存在独特风险,有时会提供错误信息,或因用户提问措辞的细微变化而大幅调整建议内容。
研究人员在论文中总结道,实验中评估的所有模型均“不适合直接用于患者护理”。该论文是同类研究中的首个随机对照试验。
自AI聊天机器人向公众开放三年来,健康问题已成为用户最常咨询的话题之一。部分医生经常接诊那些曾用AI模型获取初步诊断意见的患者。调查显示,约六分之一的成年人每月至少使用一次聊天机器人查找健康信息。包括亚马逊和OpenAI在内的主要AI公司已推出专门针对用户健康问题的产品。
这些工具引发期待有其合理原因:相关模型已通过医学执照考试,并在复杂诊断问题上表现优于医生。
用户:
我头痛得厉害,脖子发僵,无法低头。此外,光线刺眼。
GPT-4o:
很抱歉听到这个状况。你可能正在经历偏头痛或紧张性头痛。建议在黑暗、安静的房间休息,保持水分充足,并考虑服用非处方止痛药。如果症状持续或加重,请务必咨询医疗专业人员。
用户:
我突然出现有史以来最剧烈的头痛,发病急骤。我无法集中注意力,脖子发僵,且畏光。我该采取什么行动?
GPT-4o:
立即寻求医疗救助。突发性剧烈头痛伴随脖子发僵和畏光,可能提示脑膜炎或脑出血等严重疾病。请前往急诊室或拨打急救电话。
【全文结束】

