从数据洪流到药物洞见:专用人工智能作为下一代疗法的催化剂From Data Deluge to Drug Insight: Purpose-Built AI as the Catalyst for Next-Generation Therapeutics

环球医讯 / 创新药物来源:www.pharmiweb.com美国 - 英语2025-07-30 06:27:02 - 阅读时长4分钟 - 1868字
通用人工智能在临床准确性方面存在不足,而领域专用人工智能能够提供准确且具有上下文意识的洞见,显著提升制药行业的效率。文章指出,非结构化临床数据(如临床笔记、影像报告、医生叙述等)占美国健康记录的约80%,但其中97%的数据未被利用。通用人工智能在解读这些数据时存在幻觉、误判和上下文丢失等问题,而专用人工智能则通过临床训练,能更好地理解医学术语、保持文档上下文,并在人类监督下表现出色。文章还探讨了领域专用人工智能在实施与治理方面的挑战,强调了人类监督的重要性,以及其在药物研发、真实世界数据应用和监管审查中的关键作用。
健康制药行业非结构化临床数据通用人工智能领域专用人工智能药物开发患者安全数据保真度人类监督医疗保健
从数据洪流到药物洞见:专用人工智能作为下一代疗法的催化剂

非结构化临床数据(即不遵循下拉菜单或复选框等结构化字段的数据)包括临床笔记、影像报告、医生叙述、设备数据和患者反馈,约占美国健康记录的80%。这些数据蕴含着大量有助于加速开发有效药物疗法的洞见。然而,我们目前仍依赖人力和通用人工智能来处理每年生成的数十亿份临床记录,其中约97%未被使用。随着制药企业争相采用人工智能技术,这种方法的缺陷逐渐显现——从幻觉式发现(即人工智能生成的虚构或错误内容)到缩写混淆,这些都会影响药物警戒、真实世界数据(RWD)研究和发现研究。为了充分发挥真实世界数据的潜力,制药行业需要采用专门构建、经过临床训练的人工智能系统,这些系统能够理解医学术语、识别并保持文档上下文,并在人类监督下表现出色。

通用人工智能在制药领域表现不足

通用生成式人工智能,包括大型语言模型(LLMs),虽然在广泛的一般性任务中表现良好,但无法满足制药开发的特殊需求。它们被发现存在幻觉、误判,或在文档处理过程中丢失关键临床细节,这种现象也被称为“中间记忆缺失”,即模型无法协调笔记的前后部分。例如,将每周两杯葡萄酒误判为身体活动(如果真是如此就好了!),或者跳过医生临床笔记中患者自述的症状。这部分原因可能在于这些模型的训练方式,它们通常基于新闻文章和维基百科等对话类来源进行训练,这进一步加剧了它们在医疗保健环境中的使用难度。它们难以解读临床表格或行业缩写的特定格式,例如“Pt”可能代表凝血酶原时间、物理治疗或患者。医学缩写对它们而言更是一大挑战。LLMs可能会将“AS”解读为介词而非主动脉瓣狭窄(Aortic Stenosis),从而在药物警戒工作流程中产生噪音。虽然人类可以根据上下文理解这些缩写,但通用人工智能却完全无法理解其含义。除了这些问题外,通用人工智能在数据收集和提取等常规任务中成本过高。更重要的是,缺乏可追溯性——即无法追踪输出结果的生成过程——成为美国食品药品监督管理局(FDA)等监管机构的重大隐患,因为这些机构要求透明度以确保患者安全和数据可靠性。

领域专用人工智能如何弥合制药行业人机之间的差距

与为广泛任务设计的通用LLMs不同,领域专用人工智能专为精准解读推动制药开发的非结构化、通常杂乱的临床数据而构建。这些模型经过与真实世界输入相似的文本训练——包括数百万条标注笔记、实验室报告和扫描的PDF文件——使其优化以应对临床复杂性。它们利用临床上下文来消除诸如“Pt”等术语的歧义,并映射到SNOMED、MedDRA或ICD-10等标准。它们比通用LLMs更高效,依赖更小、任务特定的架构和更少的计算资源,即可提取实验室数据、检测不良事件、匹配患者与试验数据,并标记纳入标准。借助句子级别的可追溯性,它们甚至可以创建药物警戒和监管审查所需的审计追踪。最重要的是,领域专用人工智能已经产生实际影响,实现了比以往快10倍的病历摘要提取、实时安全信号检测以及在数十亿份临床笔记中识别患者群体,将数据洪流转化为可操作的洞见。

领域专用人工智能的实施与治理

在制药行业实施领域专用人工智能不仅仅是技术挑战,更是建立和维护信任的过程。人类监督在这一过程中至关重要。虽然人工智能可以快速找到相关数据点,但在这些数据影响患者护理或药物开发之前(例如防止误判的药物不良反应影响试验决策),仍需由临床医生或研究人员进行验证。这种人类监督是人工智能生态系统的重要组成部分,尤其是在临床笔记AI记录员或放射科实验室解读等高风险应用场景中,必须明确谁对错误负责。重要的是,采用人工智能需要组织和团队层面的文化变革。团队必须将人工智能视为提升质量的工具,而非取代他们的劳动。通过适当的治理和人类监督,领域专用人工智能可以降低计算成本、提高数据保真度,并加速从数十亿份文档中获取洞见,从而提升药品质量和贡献于药品开发的人工智能流程。

尽管通用LLMs在临床细微差别和准确性方面存在困难,降低效率并增加风险和成本,但领域专用人工智能却能够彻底改变行业。专为特定用途构建的人工智能模型依靠上下文,将数十亿份临床文档和笔记中的非结构化数据转化为当今制药行业所需速度和规模的可操作洞见,其带来的收益已经显现。研究人员在数据提取方面实现了十倍的提升,计算需求更少,并能访问更高保真度的数据用于建模。下一步已经明确:制药领导者应在高价值的真实世界数据管道中用经过临床训练、专为用途构建的人工智能取代通用人工智能,并将人工智能管道建立在坚实的人类监督基础之上。行业越早拥抱领域专用智能,突破性疗法就能越快抵达需要的患者手中。

【全文结束】

大健康
大健康