据《政治》(Politico)7月9日报道,10XBeta公司首席执行官马塞尔·博塔(Marcel Botha)提到了美国食品药品监督管理局(FDA)的人工智能模型“Elsa”(艾尔莎)在准确性方面遇到的初步挑战。
重点摘要
- 匿名的FDA消息人士报告称,该机构的AI平台“Elsa”存在幻觉问题。
- “Elsa”是一款大型语言模型(LLM),旨在提高FDA工作人员阅读、写作和总结的效率。
- FDA局长马克·马卡里(Mark Makary)承认了幻觉问题,并确认该机构使用AI仍然是可选的。
“Elsa模型在FDA的初始发布中遇到的一个挑战是,它容易产生幻觉,”博塔说。“我的意思是,它会编造东西。在核心成分和结构的关键分析上,我们不能让我们的AI这样做。这些微小的偏差可能会决定某种物质是否安全。”
据美国有线电视新闻网(CNN)周三报道,Elsa的问题仍在持续。引用了六位匿名的FDA官员的说法,其中一些仍在该机构,另一些则已离职。报道解释称,尽管该大型语言模型可以生成会议摘要,但它引用了不存在的研究,导致出现幻觉。
“任何你没有时间双重检查的东西都是不可靠的,”其中一位匿名的FDA官员告诉CNN。“它自信地产生幻觉。”
艾尔莎的推出
Elsa是一款大型语言模型助手,旨在帮助FDA员工更快地“阅读、写作和总结”。该工具可以总结不良事件以支持安全评估、快速进行标签比较,甚至为内部数据库生成代码,同时在安全的GovCloud环境中运行,不会对行业提交的数据进行训练,从而保护关键的研究数据。
FDA局长马蒂·马卡里(Marty Makary)医学博士、公共卫生硕士在一段6月的视频中介绍了Elsa,并表示该机构正在使用Elsa“加快临床方案审查,减少完成科学审查的总体时间”。
马卡里在视频中说,一位评审员表示,原本需要几天的任务现在只需6分钟。FDA首席AI官杰里米·沃尔什(Jeremy Walsh)表示:“今天标志着FDA人工智能时代的黎明,随着Elsa的发布,人工智能不再是一个遥远的承诺,而是一种动态的力量,增强和优化每位员工的绩效和潜力。”
在接受CNN采访时,马卡里承认,像任何大型语言模型一样,Elsa也可能会产生幻觉,员工使用它是为了组织和效率,且使用是可选的。他补充说,Elsa将会改进,FDA官员也会更好地使用它。
重塑FDA
2025年,唐纳德·J·特朗普总统的重点之一是减少联邦工作人员,包括FDA,其中约3500个职位被削减。许多其他高级官员也离职去了行业或其他地方工作。
这导致了一些缓慢。4月,《华尔街日报》报道称,FDA错过了截止日期并忽视了行业信息,导致试验延误。6月,该机构错过了对KalVista Pharmaceuticals公司sebetralstat的PDUFA数据,引用了“繁重的工作量和有限的资源”,根据KalVista的一份新闻稿。这种药物已于7月15日获得批准。
4月1日,前FDA局长斯科特·戈特利布(Scott Gottlieb)医学博士发表评论,担心FDA将回到“药品滞后”的时代。
“通过一代人的国会行动、对专业知识的投资和招聘,以及谨慎的政策制定,我们将FDA打造成了世界上最高效、最前瞻性的药品监管机构——并使美国成为全球生物制药创新的中心,”戈特利布在X(前Twitter)上于4月1日发帖说。“今天,对这一药物发现企业的持续攻击,正迅速给美国消费者带来令人沮丧的延迟,特别是影响罕见疾病和重大未满足医疗需求的领域。”
人工智能的担忧
避免这些延迟正是人工智能在政府计划中的用武之地。卫生与公共服务部长小罗伯特·F·肯尼迪(Robert F. Kennedy Jr.)和马卡里一直在推动使用人工智能来简化和加速审查和批准过程。但根据CNN的报道,目前还未能实现。两位匿名的FDA工作人员表示,Elsa还不能协助审查工作。
外部观察人士也开始提出担忧。律师事务所Hogan Lovells在一份客户警报中质疑了该工具输出的监管方式,是否存在评估其性能的基准,以及“人在循环中”流程是如何执行的。“目前尚不清楚该机构如何定义Elsa的成功,以及是否有防护措施防止AI生成的错误影响监管决策,”该公司写道。
马卡里对人工智能的雄心远不止于行政工具。他在6月发表在《美国医学会杂志》(JAMA)上的评论文章中,与合著者、FDA生物制品评估与研究中心主任文尼·普拉萨德(Vinay Prasad)医学博士一起,描绘了对药物申请进行“快速或即时审查”、更快的食品安全警报,以及通过透明度和创新重建公众信任的愿景。他将Elsa和其他机构AI工具的目标比作“曲速行动”的速度,后者帮助在创纪录的时间内交付了新冠疫苗。
人工智能如何帮助——最终
在接受PharmExec采访时,博塔表示,理论上,人工智能可以帮助FDA进行审查工作。
“它可以查看复杂的提交材料,并完成许多分析成分、遵循的流程、检查完整性等传统上需要人类完成的工作,”博塔说。“它还可以迅速检查是否有任何异常需要人类标记,因为它没有遵循协议或基于过去的经验或数据集所理解的协议。”
但像任何大型语言模型一样,时间和训练数据是关键。
“为了在FDA内制定成功的人工智能战略,该组织必须从用于构建特定于药物发现的LLM的训练数据集开始,”博塔解释道。“它为这个大型语言模型提供了什么样的框架来参考过去最佳实践,以及采取了什么样的防护措施,以确保它不只是重复过去70年的现状?”
他补充道:“人工智能将为FDA带来的好处,仍然非常接近机器学习的边缘。”
来源
- Owermohle, Sarah. FDA的人工智能本应革新药物审批。它正在编造研究。CNN。2025年7月23日。
- FDA发布全机构AI工具以优化美国人民的绩效。FDA。2025年6月2日。访问于2025年7月23日。
- KalVista Pharmaceuticals宣布由于FDA资源限制,FDA将不满足Sebetralstat NDA治疗遗传性血管性水肿的PDUFA目标日期。KalVista。2025年6月13日。访问于2025年7月23日。
- 戈特利布,斯科特。在X上的帖子。
【全文结束】


