利用进化原理的全蛋白质组人工智能模型助力罕见疾病诊断Proteome-Wide AI Model Supports Rare Disease Diagnosis Using Evolution

环球医讯 / AI与医疗健康来源:www.genengnews.com美国 - 英语2025-12-04 02:35:14 - 阅读时长2分钟 - 996字
哈佛医学院与巴塞罗那基因组调控中心的研究团队在《自然·遗传学》发表突破性成果,开发出popEVE人工智能模型,该模型创新性整合进化数据和人类群体数据库,实现全蛋白质组范围的基因变异有害性精准评估,有效解决罕见疾病诊断中错义变异的解读难题;popEVE使医生仅凭患者自身遗传信息即可优先聚焦高破坏性变异,在31,000多个发育障碍儿童家庭验证中以98%准确率识别致病突变,性能超越AlphaMissense等现有技术,并发现123个全新候选疾病基因,同时通过缓解遗传数据库人群代表性不足问题,显著提升诊断效率、降低成本并促进医疗公平性,为全球罕见病诊疗带来革命性突破。
健康罕见疾病诊断全蛋白质组人工智能模型popEVE进化原理遗传变异有害性评估致病突变发育障碍
利用进化原理的全蛋白质组人工智能模型助力罕见疾病诊断

错义变异在遗传学解释中一直是个挑战,因其影响微妙且依赖上下文。尽管现有预测模型在已知疾病基因上表现良好,但在蛋白质组未知区域的泛化能力有限。

哈佛医学院和巴塞罗那基因组调控中心(CRG)的研究人员在《自然·遗传学》发表的一项新研究中,推出了popEVE——一种深度生成模型,结合进化数据和人类群体数据,可在全蛋白质组范围内评估变异的有害性。popEVE通过让医生优先关注最具破坏性的变异,辅助罕见疾病诊断。该模型仅需患者的遗传信息即可工作,这对于医疗资源有限的罕见病医学领域尤为宝贵,使诊断更快捷、简便且经济。

“诊所并不总能获取父母的DNA,许多患者独自前来。popEVE能帮助这些医生识别致病突变,我们已从与诊所的合作中看到效果,”该研究的共同通讯作者、基因组调控中心研究员迈法尔达·迪亚斯博士表示。

致病遗传变异的空间过于庞大,无法仅通过群体变异或疾病相关实验检测来研究。地球生命的生物多样性提供了跨越数十亿年进化的遗传变异更深层视角,为揭示为维持适应性而保存的复杂遗传模式提供了独特机会。计算模型通过比较多种物种的蛋白质序列,可学习哪些氨基酸位置对生命至关重要。2021年,该团队发布了EVE(变异效应进化模型),利用进化模式将人类疾病基因中的突变分类为良性或有害。尽管EVE能判断基因内突变的影响,但其评分在不同基因间不可直接比较。

popEVE通过结合进化数据与来自英国生物银行(UK Biobank)和gnomAD的信息来解决这一问题,后者提供健康个体中存在的变异数据以校准模型。

为验证popEVE,研究人员分析了31,000多个患有严重发育障碍儿童的家庭遗传数据。在98%已确定致病突变的病例中,popEVE正确将该变异列为儿童基因组中最具破坏性的。该模型性能优于DeepMind的AlphaMissense等最先进竞争对手。

popEVE发现了123个此前从未与发育障碍相关联的新候选疾病基因。许多基因在发育中的大脑中活跃,并与已知疾病蛋白发生物理相互作用。104个基因仅在一到两名患者中被观察到。

该模型还解决了遗传数据库中人群代表性不足的问题,以支持所有患者。

“没有人应仅因其社区在全球数据库中代表性不足而获得令人担忧的结果。popEVE有助于纠正这种不平衡,这是该领域长期缺失的,”该研究的共同通讯作者、基因组调控中心研究员乔纳森·弗雷泽博士表示。

【全文结束】

大健康
大健康