企业扩展AI健康服务尽管准确性问题仍然存在 - AI与医疗健康

第45期

2026年4月23日

企业扩展AI健康服务，尽管准确性问题仍然存在

Joel Luther, Hagere Yilma, Irving Washington

重点内容

2026年至今，已有五家科技公司推出面向消费者的AI健康工具，反映了用户对这种便捷健康信息来源的需求，尽管关于AI可靠性的质疑仍未解决。

一个几十年前的世界卫生组织分类在网上被误传，暗示激素避孕药最近被发现会导致癌症，这说明即使没有明显的虚假信息，错误和误导性的健康声明也能传播。

AI与新兴技术

可靠性和准确性

用户可能认为访问个人健康数据使这些工具能够提供比通用AI搜索更准确和个性化的回应。然而，尽管这些工具增加了更多个性化功能，但它们所基于的底层模型可能仍面临基本的可靠性挑战。今年早些时候发表在《自然医学》上的一项研究发现，在常见医疗场景中使用早期版本AI聊天机器人识别相关病症并确定适当行动的参与者，表现并不比使用家庭自有资源（如在线搜索）而无AI辅助的对照组更好。研究人员观察到，描述相同症状的用户有时会收到相互矛盾的建议，部分原因是用户提问的方式不同，但也因为聊天机器人有时会误解提示并给出不一致或不正确的回应。研究作者指出，较新的模型可能在医疗基准测试中表现更高，但尚不清楚这些改进是否会转化为实际应用中的性能提升。最近，西奈山医院的一项研究发现，在结构化临床测试中，ChatGPT Health对超过一半的医疗紧急情况评估不足，可能将患有严重医疗状况的患者引导至常规随访而非紧急护理。

订阅模式和访问权限

尽管可靠性问题持续存在，KFF 2026年3月健康信息与信任追踪调查显示，约三分之一（32%）的成年人已转向AI获取健康信息和建议，其中四成用户表示已上传个人医疗信息以获取个性化建议。然而，成本和获取途径可能影响谁能依赖这些工具。ChatGPT Health目前在所有会员级别（包括免费计划）均可使用，而Perplexity Health、Claude for Healthcare的个人健康整合以及亚马逊健康AI则需要付费订阅或会员资格。Copilot Health目前免费提供，但微软表示最终将转向付费订阅模式，价格尚未公布。

KFF调查显示，看医生的费用是一些人转向AI的动机，约五分之一（19%）的人表示"无法负担看医生的费用"是使用AI获取健康建议的"主要原因"，在18至29岁的用户中这一比例上升至三成（29%）。通过直接整合医疗记录提供最个性化功能的工具正越来越多地设置付费门槛，可能使那些已经难以负担医疗保健的人无法使用。

为什么这很重要

随着面向消费者的AI健康工具扩展，这些工具提供的个性化与可靠性之间的差距可能影响人们接收的健康信息质量，而成本问题可能进一步限制这些工具的实用性。

我们关注的内容

AI聊天机器人传播虚构疾病诊断，实验发现

一组研究人员发明了一种名为"bixonimania"的虚构皮肤病，并将两篇关于它的虚假学术论文上传到预印本服务器，以测试AI聊天机器人是否会将这种虚构病症视为真实。据《自然》新闻报道，在几周内，包括微软Copilot、谷歌Gemini、Perplexity和ChatGPT在内的主要AI系统就开始向用户描述这种不存在的病症，仿佛它是真实的，有时甚至建议他们去看眼科医生。这些虚假论文包含明显的伪造迹象，致谢部分感谢"星际舰队学院"和"Sidehow Bob教授"，并在文本中明确声明"整篇论文都是编造的"。然而，当用户直接询问或描述与虚假论文中描述的症状相符时，聊天机器人将该病症视为真实。《自然》报道称，这些模型后来已被修正，不再将bixonimania引用为真实病症。

这一问题不仅限于聊天机器人：至少有一份同行评审期刊发表了一篇引用这些虚假预印本作为合法研究的论文。该论文后来已被撤回，但参与实验的研究人员表示，其发表指出了一个更广泛的问题，即一些学者在未阅读基础论文的情况下使用AI生成的参考文献。

值得关注的是： KFF 3月健康信息与信任追踪调查显示，在使用AI获取身体健康的建议的成年人中（占成年人的29%），约七成（69%）表示对这些工具提供可靠健康信息至少有"相当程度"的信任，尽管很少有人（6%）表示"非常信任"这些聊天机器人。随着人们转向AI聊天机器人获取健康信息，这些系统如何决定哪些健康信息可信以及这可能如何影响信任仍是一个悬而未决的问题。

使用AI和社交媒体获取健康信息的人更看重便利性而非准确性，多项调查显示许多人难以判断应信任哪些信息

根据皮尤研究中心的一项新调查，医疗保健提供者仍然是最常见和最受信任的健康信息来源。约三分之二（65%）从医疗保健提供者获取健康信息的人将其评为"极其"或"非常"准确，超过任何其他来源，包括政府卫生机构、新闻组织、社交媒体或AI。AI聊天机器人和社交媒体的用户将这些来源在便利性方面评分高于准确性，这表明人们使用这些来源的原因与他们对其的信任程度之间存在差距。

随着一些成年人转向社交媒体或AI获取健康信息，皮尤的调查还发现，许多成年人难以判断他们遇到的健康信息是否准确，一半的公众表示判断所见健康信息的准确性至少"有些困难"。此外，大多数成年人（76%）表示他们听到的健康信息似乎与他们收到的其他健康信息相冲突，当这种情况发生时，略超过一半（54%）的人表示很难知道该信任哪条信息。

值得关注的是： 这些发现为KFF调查提供了背景，后者同样发现医疗保健提供者是最受信任的健康信息来源，尽管公众对政府卫生机构的信任度因党派观点变化而下降。随着人们更多地出于便利性而非对其准确性的信任而转向AI和社交媒体获取健康信息，他们愿意使用自己不完全信任的来源可能为虚假或误导性健康声明的传播创造机会。与此同时，医生和其他提供者在大多数公众中仍处于作为受信任健康信息传递者的独特地位。

关于避孕药和癌症的虚假声明省略了背景信息，夸大了风险

声称世界卫生组织最近将避孕药列为1类致癌物的说法已在网上传播广泛，包括一些浏览量超过200万次的社交媒体帖子。

这是一个没有背景信息的内容无法提供避孕措施风险和益处完整图景的例子。虽然这一分类是真实的，但并非新近：口服避孕药于1999年被归入该类别，基于证据表明它们可能增加某些癌症（包括乳腺癌和宫颈癌）的风险。但一些传播的帖子省略了这到底意味着什么的背景。1类分类表明在某些情况下有充分证据证明存在关联，而非癌症是可能的结果。

一项2025年追踪超过200万名女性的大型瑞典研究发现，当前或近期使用者的乳腺癌诊断率有小幅短期上升，但患癌的绝对风险仍然很低。KFF Health News报道，该研究本身在社交媒体上被扭曲，一些帖子引用了乳腺癌诊断率提高24%，但没有指出这相当于每年每10万名女性中大约增加13例。其他研究发现，激素避孕药可以降低卵巢癌和子宫内膜癌的风险，这一发现未包含在网上传播的帖子中。这些帖子说明，即使不包含明显虚假信息，脱离背景的科学信息和数据省略也能传播误导性声明。

值得关注的是： KFF 2025年7月健康信息与信任追踪调查显示，约五分之一（22%）的成年人在过去一个月在社交媒体上看到过与避孕相关的内容，包括更高比例的18-29岁成年人（39%）。然而，跨平台的社交媒体用户中，不到一半表示他们信任所看到的大部分或一些健康信息和建议。美国疾病控制与预防中心的数据显示，女性的避孕选择在其生殖生命过程中会发生变化，一些人在后期会选择更长期的方法，如宫内节育器（IUDs）和植入物。然而，口服避孕药继续是美国最常用的可逆避孕方法。持续的社交媒体活动扭曲激素避孕方法的风险可能影响关于避孕安全性和使用的对话，特别是对年轻女性而言。

KFF更多信息

KFF快速解读：《药物堕胎获取的最新情况：法院等待FDA审查》
KFF Health News：《观察：随着AI做出更多健康覆盖决策，对患者的风险增加》
KFF政策观察：《麻疹消除状态：它是什么以及美国如何可能失去它》

健康信息与信任倡议的支持由罗伯特·伍德·约翰逊基金会(RWJF)提供。所表达的观点不一定反映RWJF的观点，KFF对其所有政策分析、民意调查和新闻活动保持完全的编辑控制权。监测报告中分享的数据来源于KFF进行的媒体监测研究。

【全文结束】

企业扩展AI健康服务尽管准确性问题仍然存在Companies Expand AI Health Offerings, Even as Accuracy Questions Remain — The Monitor | KFF

企业扩展AI健康服务，尽管准确性问题仍然存在