三分之一美国人称曾请AI解码医疗报告 医生希望你了解的关键事项Asking AI to explain your medical results? What doctors want you to know | Scientific American

环球医讯 / AI与医疗健康来源:www.scientificamerican.com美国 - 英语2026-05-31 02:09:41 - 阅读时长5分钟 - 2145字
随着《21世纪治愈法案》推动医疗数据透明化,三分之一美国成年人转向大型语言模型解读检验报告、诊断症状或查询药物信息,本文基于加州大学旧金山分校等机构专家观点,揭示AI在提升患者参与度的同时存在误诊风险——如西雅图75岁白血病患者因采纳错误AI建议拒绝治疗致死的案例,研究显示仅三分之一用户能通过LLM获得正确诊断,专家建议将聊天机器人定位为医患沟通准备工具而非替代品,强调需删除个人信息、要求模型自我复核并培养新型AI医疗素养,最终指出在医疗资源短缺危机下,谨慎使用AI仍优于完全缺乏医疗服务。
AI医疗解读健康信息获取医患对话AI医疗风险患者赋权AI医疗素养医疗报告解码
三分之一美国人称曾请AI解码医疗报告 医生希望你了解的关键事项

当朱迪思·米勒(Judith Miller)去年收到医学影像检查结果时,这位77岁的威斯康星州居民做了当下许多患者会做的事:请人工智能解释报告。由Anthropic公司开发的大型语言模型Claude提供了可能的解读方案。手持聊天机器人的分析结果,米勒在后续复诊中与医生展开了富有成效的对话。她表示,Claude的回复"帮助我更好地理解自身健康状况,并更充分地参与共同决策"。

此类场景如今已遍布全美诊所。两项最新民调均显示,三分之一美国成年人曾使用大型语言模型获取健康信息——用于解读化验结果、诊断症状、研究治疗方案或查询处方药。"这类工具的使用量在过去一年翻倍,"加州大学旧金山分校医师罗伯特·瓦赫特(Robert Wachter)表示,"我预计明年将再次翻倍。"

但专家警告这些聊天机器人可能提供误导性或不准确的建议。Anthropic公司发言人对此表示认同:"Claude并非设计或推广用于临床诊断,其恰当用途是帮助人们为医患对话做准备,而非取代医生。"

对许多患者而言,人工智能为《21世纪治愈法案》带来的个人健康数据泛滥问题提供了可喜解决方案。该法案强制要求即时在线获取检验结果和临床记录等医疗档案。"如果你看过这些材料,"医疗博主兼活动家戴夫·德布龙卡特(Dave deBronkart)说,"就会产生巨大疑问:这些数据究竟意味着什么?"数年前,这些意义还隐藏在只有医生能理解的医学术语壁垒之后。由于患者能在见医生前在线查看结果,他们常陷入焦虑。如今,通用聊天机器人和各类专业医疗模型能在数秒内将术语转化为平实语言,可能缓解无端恐惧。

然而它们也可能不必要地加剧焦虑——甚至更糟。大型语言模型仍易犯错,可能将谬误表述为事实,并阿谀逢迎式强化用户的既有(有时是错误的)观念。尽管模型能力提升或可减轻这些缺陷,许多专家仍担忧当前AI模型如此使用的潜在风险。"几乎不存在阻止它们出错的护栏,"非营利组织OpenNotes执行董事凯特·德罗奇斯(Cait DesRoches)说,"当人们将LLM视为医疗权威时会发生什么,这方面的研究极少——我认为我们完全不清楚这对普通患者效果如何。"

最坏情况已浮现。去年12月,一名75岁的西雅图男子因可治疗的白血病死亡,据报道他基于AI生成的错误证据(声称其患有罕见并发症)拒绝接受治疗。关于人们如何用AI进行医疗诊断的初步研究令人警醒。《自然医学》2月发表的研究要求参与者在多种LLM协助下诊断假设病症,结果仅约三分之一人得出正确结论。

尽管如此,多数专家认为谨慎使用下,聊天机器人对寻求医疗信息者确有帮助。"我不认为人们应避免使用它们,"德罗奇斯说,"但我强调必须睁大眼睛使用。"贝斯以色列女执事医疗中心内科医生亚当·罗德曼(Adam Rodman)更进一步表示:"如果使用得当——这是个重要前提——LLM堪称有史以来最佳的患者赋权工具。"

为在保障安全前提下利用该技术,研究人员开发出一系列策略弥补AI缺陷。例如建议让聊天机器人扮演医生角色,罗德曼解释这可能"促使模型以医师方式收集数据"。其他技巧包括要求LLM严格复核自身推理,以及向不同模型寻求"第二诊疗意见"。罗德曼特别强调删除聊天输入中的姓名、社保号等个人信息以保护隐私的重要性。

理想情况下,经过数字对话后,患者应带着更明智的问题面诊医生。瓦赫特称此趋势"总体健康",但有时需耗费宝贵时间驳斥聊天机器人的错误建议。"我只有15分钟问诊时间,"他说,"却得花前10分钟说服患者放弃GPT建议的做法。"

在许多情况下,LLM可能完全取代了真实临床建议,尤其对无保险或预约等待期长的人群。"医疗可及性问题已至危机级别,"国家医学院AI事务高级顾问劳拉·亚当斯(Laura Adams)说。尽管技术存在局限,她主张应将其与现实而非完美比较——因为替代方案可能是完全缺乏医疗照护。"总比没有强,"她说。

亚当斯指出,就AI与医疗建议而言,"木已成舟"。随着更多人依赖聊天机器人管理健康,研究人员和患者权益倡导者认为此刻亟需新型AI医疗素养。"补救之道不是让民众无知,"德布龙卡特说,"而是通过教育儿童和成人教会他们更好使用。"此外,新一代LLM在医疗应用上或有改善——瓦赫特建议某些模型未来可能像真正医师那样获得执照认证。

目前,米勒这样的使用者正按德罗奇斯的建议行事:睁大眼睛使用,清醒认识AI产生幻觉和确认用户偏见的倾向。尽管聊天机器人回复看似精密,它们实则由大数据统计模式拼接而成——这虽是了不起的技巧,仍远未达到人类临床推理的广度与可靠性。"它只是按概率衔接词语,"米勒说,"我不将其视为绝对真理的来源。"

【全文结束】