Bixonimania是一种虚构疾病——但ChatGPT却向数千人做出诊断其他AI也是如此 - AI与医疗健康

Bixonimania是一种虚构疾病——但ChatGPT却向数千人做出诊断其他AI也是如此‘Bixonimania’ Is a Fake Disease—But ChatGPT Diagnosed It to Thousands, Other AI Did Too | Nurse.Org

环球医讯 / AI与医疗健康来源：nurse.org美国 - 英语2026-05-18 23:34:12 - 阅读时长5分钟 - 2163字

瑞典研究人员创造了一种名为"bixonimania"的虚假眼部疾病并植入伪造学术论文中，尽管论文包含明显警示标志，ChatGPT、Google Gemini等主要AI聊天机器人仍自信地将其呈现为真实疾病，甚至建议患者就医。医疗机构研究与质量改进研究所将AI聊天机器人误用列为2026年头号健康技术危害，每天有超4000万人使用ChatGPT获取健康信息，这对护士等一线医疗工作者构成重大挑战，需要提高AI素养以保护患者安全。

Bixonimania是一种虚构疾病——但ChatGPT却向数千人做出诊断其他AI也是如此

《自然》杂志发表的一项新调查显示，包括ChatGPT、Google Gemini、Microsoft Copilot和Perplexity在内的主要AI聊天机器人一直自信地向用户介绍一种根本不存在的疾病。这种被称为"bixonimania"的病症完全是由一名研究人员编造的，目的是测试AI系统是否容易被误导而传播虚假医疗信息。

这一结果对医疗行业中的任何人来说都令人警觉。聊天机器人不仅重复了这一虚假诊断，还对其进行了详细阐述，提供了类似临床建议的内容，甚至建议患者去看眼科医生。对于那些已经要应对更多"自行搜索症状"患者提问的护士而言，这一实验是对患者安全新威胁的警钟。

随着医疗机构研究与质量改进研究所(ECRI)将AI聊天机器人误用列为2026年头号健康技术危害，对于奋战在患者护理一线的护士来说，风险已无法更高。

虚假疾病如何愚弄全球最大的AI系统

瑞典哥德堡大学的医学研究员Almira Osmanovic Thunström于2024年初启动了这一实验。她创造了一种虚构的眼部疾病"bixonimania"，描述为眼睑变色和眼睛疼痛，据称是由移动设备发出的蓝光暴露引起的。然后，她将两篇伪造的学术论文上传到预印本服务器，以测试AI聊天机器人是否会吸收并重复这些虚假信息。

这些论文充满了本应无法忽视的警示标志：

虚构的主要作者据称在不存在的"加利福尼亚州新城市"(Nova City, California)的"Asteria Horizon University"工作。
致谢部分感谢了"星际舰队学院"(Starfleet Academy)的"Maria Bohm教授"，资金来源则归功于"Professor Sideshow Bob Foundation for its work in advanced trickery"（致力于高级诡计工作的Sideshow Bob教授基金会）。
论文甚至直白地声明"整篇论文都是编造的"。

Thunström特意选择了"bixonimania"这个名字。后缀"-mania"仅在精神病学中使用，因此任何合法的眼部疾病都不可能带有这一标签。

多家主要AI工具声称该疾病真实存在（但它并不存在）

尽管研究论文中故意包含了警示标志，AI系统仍惨遭失败：

Microsoft Copilot宣称"bixonimania确实是一种引人入胜且相对罕见的疾病"。
Google Gemini告诉用户"bixonimania是由过度暴露于蓝光引起的一种病症"，并建议人们去看眼科医生。
Perplexity AI甚至更进一步，告诉一位用户全球有9万人正遭受这种疾病的困扰。

AI为何会陷入医疗错误信息

bixonimania实验并非孤立事件。其他研究发现，当源材料看起来很专业时，大型语言模型特别容易受到医疗错误信息的影响。

一项研究检查了20种不同的大型语言模型(LLM)，发现当文本格式类似于临床论文或医院出院记录时，与社交媒体帖子相比，AI聊天机器人对虚假信息产生幻觉并进行详细阐述的比率更高。

《自然》报告中，研究员Omar指出："当文本看起来专业且像医生写的那样，幻觉率就会增加。"

现实世界的后果已经显现：

印度Maharishi Markandeshwar医学院和研究所的三位研究人员在施普林格·自然(Springer Nature)出版的同行评审期刊《Cureus》上发表了一篇论文，将bixonimania预印本引用为合法来源。
一旦骗局被发现，该论文随后被撤回。

4000多万人使用ChatGPT获取健康信息

问题远不止于一种虚假疾病。医疗机构研究与质量改进研究所(ECRI)2026年健康技术危害报告显示，聊天机器人在回答医疗问题时提出了错误诊断、推荐不必要的检查、推广次标准医疗用品，甚至编造不存在的解剖结构。所有这些都以自信、权威的语气呈现，使AI回复极具说服力。

风险的规模巨大。根据OpenAI的分析，每天有超过4000万人使用ChatGPT获取健康信息。随着医疗成本上升和诊所关闭减少了就医渠道，更多患者可能会将聊天机器人作为专业医疗建议的替代品。

护士需要了解的内容

这个故事对护士很重要，因为你们是最有可能遇到在进门之前就已经咨询过AI聊天机器人的患者的专业人士。一位患者可能会坚信自己患有一种他们在ChatGPT或Gemini上读到的疾病，包括由无法区分真实疾病和"Sideshow Bob教授基金会"资助的疾病的系统生成的症状和治疗建议。

护士应准备好温和地引导那些提出AI来源健康主张的患者，利用这一机会强化专业临床判断的价值。医疗机构研究与质量改进研究所(ECRI)建议医疗机构建立AI治理委员会，为临床医生提供AI素养培训，并定期审核AI工具的性能。如果你的医疗机构尚未开始这些对话，现在就是倡导它们的时刻。

【全文结束】