罕见基因变异如何影响健康?人工智能提供更准确预测How do rare genetic variants affect health? AI provides more accurate predictions

环球医讯 / AI与医疗健康来源:medicalxpress.com德国 - 英语2024-09-25 17:00:00 - 阅读时长4分钟 - 1629字
德国癌症研究中心、欧洲分子生物学实验室和慕尼黑工业大学的研究团队开发了一种基于深度学习的算法,可以更准确地预测罕见基因变异的影响。
罕见基因变异健康人工智能疾病预测DeepRVAT德国癌症研究中心欧洲分子生物学实验室慕尼黑工业大学遗传易感性个性化医疗
罕见基因变异如何影响健康?人工智能提供更准确预测

我们是否容易患上特定疾病在很大程度上取决于基因组中无数的变异。然而,特别是那些在人群中极少出现的基因变异,其对某些病理特征的影响一直难以确定。德国癌症研究中心(DKFZ)、欧洲分子生物学实验室(EMBL)和慕尼黑工业大学的研究人员引入了一种基于深度学习的算法,可以预测罕见基因变异的影响。该论文《通过深度集合网络整合变异注释以增强罕见变异测试》已发表在《自然医学》杂志上。

该方法可以更精确地区分高风险个体,并有助于识别参与疾病发展的基因。每个人的基因组与其同类人类相比,在数百万个单独的构建块上有所不同。这些差异被称为变异。许多这些变异与特定的生物特征和疾病相关。这种关联通常通过所谓的全基因组关联研究来确定。但频率仅为0.1%或更低的罕见变异在关联研究中往往被统计忽略。

“特别是罕见变异往往对生物特征或疾病的表型有显著影响,”本研究的第一作者之一布赖恩·克拉克(Brian Clarke)说。“因此,它们可以帮助识别在疾病发展中起作用的基因,从而指引我们发现新的治疗途径,”另一位共同第一作者埃娃·霍尔特坎普(Eva Holtkamp)补充道。

为了更好地预测罕见变异的影响,由DKFZ和EMBL的奥利弗·斯特格尔(Oliver Stegle)和布赖恩·克拉克以及慕尼黑工业大学的朱利安·加涅尔(Julien Gagneur)领导的团队开发了一种基于机器学习的风险评估工具。“DeepRVAT”(罕见变异关联测试),研究人员命名的这种方法,首次在基因组关联研究中使用人工智能(AI)来解码罕见基因变异。

该模型最初是在来自英国生物银行的161,000人的序列数据(外显子序列)上进行训练的。此外,研究人员还输入了个人遗传影响的生物特征以及与这些特征相关的基因的信息。用于训练的序列包括约1300万个变异。每个变异都有详细的“注释”,提供了该变异可能对细胞过程或蛋白质结构产生的影响的定量信息。这些注释也是训练的重要组成部分。

训练完成后,DeepRVAT能够预测每个个体哪些基因因罕见变异而功能受损。为此,算法使用单个变异及其注释计算一个数值,描述基因受损的程度及其对健康的潜在影响。研究人员在英国生物银行的基因组数据上验证了DeepRVAT。对于34个测试特征,即与疾病相关的血液检测结果,该测试方法发现了352个与相关基因的关联,远超所有现有模型。DeepRVAT获得的结果非常稳健,在独立数据中的可重复性也优于替代方法。

DeepRVAT的另一个重要应用是评估某些疾病的遗传易感性。研究人员将DeepRVAT与基于更常见基因变异的多基因风险评分结合使用,显著提高了预测的准确性,尤其是在高风险变异方面。此外,DeepRVAT还发现了许多现有测试未能发现的遗传关联,包括各种心血管疾病、癌症、代谢和神经性疾病。

“DeepRVAT有可能显著推进个性化医疗。我们的方法不受特征类型限制,可以灵活地与其他测试方法结合使用,”物理学家和数据科学家奥利弗·斯特格尔说。他的团队现在希望尽快在大规模试验中进一步测试风险评估工具,并将其投入应用。科学家们已经与INFORM组织者联系。该研究旨在利用基因组数据为复发性儿童癌症患者提供个性化治疗。DeepRVAT可以帮助揭示某些儿童癌症的遗传基础。

“我认为DeepRVAT在罕见疾病应用中的潜在影响令人兴奋。罕见疾病研究的一个主要挑战是缺乏大规模、系统性的数据。通过利用AI的力量和英国生物银行中的50万个外显子,我们客观地识别出了哪些基因变异最显著地损害了基因功能,”慕尼黑工业大学的朱利安·加涅尔说。下一步是将DeepRVAT整合到德国人类基因组表型档案(GHGA)的基础设施中,以促进诊断和基础研究中的应用。

DeepRVAT的另一个优势是,该方法所需的计算能力显著低于类似模型。DeepRVAT作为一个用户友好的软件包,可以使用预训练的风险评估模型或用研究人员自己的数据集进行专门训练。


(全文结束)

大健康
大健康