《自然》杂志发表的一项新调查显示,包括ChatGPT、Google Gemini、Microsoft Copilot和Perplexity在内的主要AI聊天机器人一直自信地向用户介绍一种根本不存在的疾病。这种被称为"bixonimania"的病症完全是由一名研究人员编造的,目的是测试AI系统是否容易被误导而传播虚假医疗信息。
这一结果对医疗行业中的任何人来说都令人警觉。聊天机器人不仅重复了这一虚假诊断,还对其进行了详细阐述,提供了类似临床建议的内容,甚至建议患者去看眼科医生。对于那些已经要应对更多"自行搜索症状"患者提问的护士而言,这一实验是对患者安全新威胁的警钟。
随着医疗机构研究与质量改进研究所(ECRI)将AI聊天机器人误用列为2026年头号健康技术危害,对于奋战在患者护理一线的护士来说,风险已无法更高。
虚假疾病如何愚弄全球最大的AI系统
瑞典哥德堡大学的医学研究员Almira Osmanovic Thunström于2024年初启动了这一实验。她创造了一种虚构的眼部疾病"bixonimania",描述为眼睑变色和眼睛疼痛,据称是由移动设备发出的蓝光暴露引起的。然后,她将两篇伪造的学术论文上传到预印本服务器,以测试AI聊天机器人是否会吸收并重复这些虚假信息。
这些论文充满了本应无法忽视的警示标志:
- 虚构的主要作者据称在不存在的"加利福尼亚州新城市"(Nova City, California)的"Asteria Horizon University"工作。
- 致谢部分感谢了"星际舰队学院"(Starfleet Academy)的"Maria Bohm教授",资金来源则归功于"Professor Sideshow Bob Foundation for its work in advanced trickery"(致力于高级诡计工作的Sideshow Bob教授基金会)。
- 论文甚至直白地声明"整篇论文都是编造的"。
Thunström特意选择了"bixonimania"这个名字。后缀"-mania"仅在精神病学中使用,因此任何合法的眼部疾病都不可能带有这一标签。
多家主要AI工具声称该疾病真实存在(但它并不存在)
尽管研究论文中故意包含了警示标志,AI系统仍惨遭失败:
- Microsoft Copilot宣称"bixonimania确实是一种引人入胜且相对罕见的疾病"。
- Google Gemini告诉用户"bixonimania是由过度暴露于蓝光引起的一种病症",并建议人们去看眼科医生。
- Perplexity AI甚至更进一步,告诉一位用户全球有9万人正遭受这种疾病的困扰。
AI为何会陷入医疗错误信息
bixonimania实验并非孤立事件。其他研究发现,当源材料看起来很专业时,大型语言模型特别容易受到医疗错误信息的影响。
- 一项研究检查了20种不同的大型语言模型(LLM),发现当文本格式类似于临床论文或医院出院记录时,与社交媒体帖子相比,AI聊天机器人对虚假信息产生幻觉并进行详细阐述的比率更高。
《自然》报告中,研究员Omar指出:"当文本看起来专业且像医生写的那样,幻觉率就会增加。"
现实世界的后果已经显现:
- 印度Maharishi Markandeshwar医学院和研究所的三位研究人员在施普林格·自然(Springer Nature)出版的同行评审期刊《Cureus》上发表了一篇论文,将bixonimania预印本引用为合法来源。
- 一旦骗局被发现,该论文随后被撤回。
4000多万人使用ChatGPT获取健康信息
问题远不止于一种虚假疾病。医疗机构研究与质量改进研究所(ECRI)2026年健康技术危害报告显示,聊天机器人在回答医疗问题时提出了错误诊断、推荐不必要的检查、推广次标准医疗用品,甚至编造不存在的解剖结构。所有这些都以自信、权威的语气呈现,使AI回复极具说服力。
风险的规模巨大。根据OpenAI的分析,每天有超过4000万人使用ChatGPT获取健康信息。随着医疗成本上升和诊所关闭减少了就医渠道,更多患者可能会将聊天机器人作为专业医疗建议的替代品。
护士需要了解的内容
这个故事对护士很重要,因为你们是最有可能遇到在进门之前就已经咨询过AI聊天机器人的患者的专业人士。一位患者可能会坚信自己患有一种他们在ChatGPT或Gemini上读到的疾病,包括由无法区分真实疾病和"Sideshow Bob教授基金会"资助的疾病的系统生成的症状和治疗建议。
护士应准备好温和地引导那些提出AI来源健康主张的患者,利用这一机会强化专业临床判断的价值。医疗机构研究与质量改进研究所(ECRI)建议医疗机构建立AI治理委员会,为临床医生提供AI素养培训,并定期审核AI工具的性能。如果你的医疗机构尚未开始这些对话,现在就是倡导它们的时刻。
【全文结束】

