在最近发表在《科学报告》(Scientific Reports)杂志上的一篇论文中,研究人员提出了PromptSE作为解决当前预测药物不良副作用局限性的潜在方案。PromptSE是一种新型混合计算框架,旨在结合大型语言模型(LLMs)的语义推理能力和深度学习算法的预测精确度。
研究结果表明,通过引导AI评估可能构成症状基础的生物机制,这种新方法在多个传统的副作用预测模型上表现更优。这些发现表明,PromptSE和类似的AI框架可能为更安全的药物开发铺平道路,并有可能为药理学筛查提供更可靠的计算工具。
背景
尽管该领域已有数十年的研究,预测药物不良反应在现代医疗保健中仍然是一个重大挑战。治疗药物的非预期反应目前在主要死因中排名第四,仅排在心血管疾病(CVD)、癌症和传染病之后。
虽然在实验室环境中识别风险在技术上是可行的,但众所周知,这种方法成本高昂且耗时。因此,研究人员主要依靠计算模型来预测特定药物是否可能引发特定的不良反应。
不幸的是,相关主题的综述表明,这些模型在很大程度上受到当前数据质量的限制。虽然化学化合物的结构化数据很容易获得,但副作用信息通常埋藏在非结构化的临床叙述和自发症状报告中,严重阻碍了传统计算模型的准确性。
此外,虽然人工智能已被提议作为解决这一问题的潜在方案,但研究表明,较旧的机器学习算法往往关注最常提及的症状,而常常忽视可能导致不良反应的潜在生物机制。
关于研究
该研究旨在通过开发PromptSE来克服将LLM作为基本文本编码器的局限性,PromptSE是一种使用多阶段提示技术构建的动态推理人工智能框架。
该提示被设计为引导模型从以下方面评估副作用:1.给药途径,2.代谢途径,3.结构特性,以及4.靶向选择性,从而利用PromptSE推断与不良事件相关的机制相关解释,而不仅仅依赖于表面症状描述或训练数据集中的常见模式。
PromptSE使用从DrugBank和SIDER数据库派生的组合"标记药物副作用数据集"进行训练,该数据集总共包含1,020种药物和5,599种副作用。
一旦大型语言模型(LLM)基于这些数据生成机制特征,专门处理医学、临床和生物文本的独立AI模型——生物医学双向编码器表示从变换器(BioBERT)被用来将生成的特征(文本)转换为数学向量,随后输入深度学习模块以预测药物-副作用关联。
对于数据有限的罕见药物和副作用,使用了分层图卷积网络(HiGCN)使低频实体能够从更常见、记录更完善的药物或副作用中借用上下文线索,从而在降低削弱支持较好表示风险的同时提高模型准确性。
发现
研究结果表明,数据集高度偏向于未知的不良关联,只有2.34%的可能药物-副作用配对被标记为已知的阳性关联。因此,使用精确率-召回率曲线下面积(AUPR)与AUC、宏F1和马修斯相关系数一起测量PromptSE的准确性。
AUPR分析显示,PromptSE达到了0.6551的AUPR,尽管只提供了副作用数据和关联衍生的药物对齐特征而非直接药物属性,但仍优于最强的非药物信息基线9.26%。此外,当模型通过多模态药物信息增强时,性能比最强的药物信息基线进一步提高了1.81%,PromptSE+达到了0.6878的AUPR,超过了用于不良反应预测的传统"最先进基线"方法。配对自助测试显示平均AUPR差异为0.012,95%置信区间为0.008-0.013。
AI生成特征的质量也使用Kolmogorov-Smirnov(KS)测试进行了测试,该测试衡量模型如何有效地将相关与不相关的副作用对分开。大型语言模型(LLM)衍生的特征达到了0.3939的KS分数,远远优于基本文本描述(KS = 0.0195)。这支持了PromptSE更有效地按药理学相关关系而非表面语言相似性对副作用进行分组的发现。
结论
本研究解决了传统计算药物-不良事件预测模型在数据和预测能力方面的重要局限性。它成功地证明了引导推理——提示模型考虑副作用的化学和生物驱动因素——可以被利用来使当前一代AI模型生成更丰富的信息表示,并改进对特定药物潜在副作用的预测。
此外,尽管该框架专门针对副作用进行了测试,但这种范式可能适用于预测药物-药物相互作用或发现现有药物的新治疗用途。然而,需要使用外部数据集、精心整理的药理学知识库和已发表的药理学证据进行进一步验证,以加强其生物学基础和通用性。总之,本研究表明,将结构化AI推理与深度学习相结合,有可能显著加速药物发现并改善患者安全的计算方法。
期刊参考:
Xia, Y., Wang, H., Li, T., & Niu, Y. (2026). PromptSE: drug side effect prediction with LLM-derived pharmacological representations. Scientific Reports. DOI: 10.1038/s41598-026-55667-7.
【全文结束】

