利用知识图谱假设微生物与疾病间的机制联系Hypothesizing mechanistic links between microbes and disease using knowledge graphs

环球医讯 / 硒与微生态来源:www.nature.com美国 - 英语2025-08-25 18:44:13 - 阅读时长4分钟 - 1777字
本文提出了一种基于知识图谱(MGMLink)的创新方法,通过整合微生物-基因-代谢物相互作用数据,结合路径搜索与优先级排序策略,成功生成了炎症性肠病和帕金森病中微生物影响疾病的潜在机制假说,为肠道微生物组与疾病的复杂相互作用研究提供了可扩展的新范式。
微生物组知识图谱肠道微生物疾病机制炎症性肠病帕金森病机制预测模板化搜索健康微生物-宿主互作知识整合
利用知识图谱假设微生物与疾病间的机制联系

摘要

知识图谱因其对生物概念的有效表征已成为生物医学领域的重要工具。虽然已有大量证据表明肠道微生物组与疾病存在相关性,但揭示这些关联的潜在机制仍具挑战性。我们构建了一个整合微生物、基因和代谢物关联的微生物组知识图谱(MGMLink),通过最短路径搜索、模板化路径搜索及基于知识图谱结构的路径优先级排序新方法,展示了其推导微生物-宿主相互作用机制假说的能力。研究重点展示了该方法在炎症性肠病和帕金森病中的应用,实现了以可扩展且全面的方式生成肠道微生物与疾病复杂互作的机制假说。

引言

宏基因组研究日益表明肠道微生物组在疾病状态中的组成差异。多组学分析对理解微生物环境如何影响宿主代谢或遗传至关重要。自2019年以来,每年在PubMed发表的相关微生物组与疾病研究已超2万篇,建立整合现有研究的中央知识库潜力巨大。知识图谱(KG)通过实体关系描述(如基因/代谢物与疾病的关系)实现多重功能,从特定生物关系的有效检索到基于图结构的新关系预测。KG在生物医学研究中应用广泛,包括药物相互作用预测、毒性机制评估、未知药物靶点发现及电子健康记录症状关联分析。近年微生物相关KG的发展为理解微生物在多种环境中的作用提供了新可能。

方法

知识表征与整合

通过整合gutMGene数据库的微生物-宿主互作数据至PheKnowLator框架构建MGMLink。该框架采用单向关系链接模型,整合Mondo疾病本体(MONDO)、化学实体本体(CHEBI)等人机可读术语。特别采用OWL-NETS转换方法,将OWL编码知识抽象为生物学意义三元组,生成拓扑结构最简图。gutMGene数据经匹配后转化为OWL三元组,形成四种独特模式(示例见表1),新增肠道环境和物种特异性微生物节点。

表1展示了从gutMGene断言中识别的各类模式具体示例及其OWL-NETS表征方式。该数据库包含人类/小鼠宿主中微生物代谢物和基因相互作用,经360余篇PubMed文献人工提取,涵盖微生物底物、代谢物、抑制/激活基因四类断言。通过NCBI分类映射和分类边修正,将1874条gutMGene断言(涉及533个微生物分类单元)整合至原有507万条边、78万个节点的KG中,最终MGMLink包含5076297条边和782466个节点。

机制预测框架

我们采用两种路径搜索方法:全最短路径法(广度优先算法)和模板化搜索法。前者通过无权重边搜索最小边数路径,后者基于本体前缀的语义约束模板进行路径扩展。为优化路径排序,提出基于图嵌入的平均余弦相似度指标:计算路径节点与目标节点的向量相似度,按平均值排序优先级(图2)。使用Node2Vec和TransE两种嵌入方法进行比较。

结果

炎症性肠病机制解析

通过分析IBD相关微生物(如直肠真杆菌、链球菌、嗜血菌)与其宿主基因互作,应用最短路径和模板化搜索方法,揭示了链球菌与溃疡性结肠炎的关联机制。发现CCL20基因与IL-1β、前列腺素E合酶的潜在互作路径(图4),这与已知IBD中CCL20诱导促炎细胞因子IL-1β增加及PGE2在肠道稳态中的作用研究相符。模板化搜索发现的路径(微生物→基因→蛋白→蛋白→代谢物→疾病)比无向最短路径提供更多分子机制细节。

帕金森病保护机制发现

针对具有潜在保护作用的普氏粪杆菌(F. prausnitzii)研究显示,模板化搜索法相比最短路径法能发现更相关机制(图5A)。发现该微生物产生的苯甲酸可能通过抑制促炎细胞因子IL-6发挥作用(图5B),这与PD患者中该微生物丰度下降的现象相呼应。高优先级路径还发现IL-12b激活增加和一氧化氮治疗靶点的关联,突显模板化搜索在机制发现中的优势。

讨论与结论

MGMLink通过整合现有微生物-基因互作数据,扩展了机制推断的可行性。在IBD和PD中的应用表明,定向最短路径和模板化搜索能揭示更相关的机制节点。模板化搜索在微生物-疾病机制探索中的重要性,以及语义约束在机制搜索中的必要性得到验证。相比传统机制推断方法,本方法通过识别和优先级排序KG中的长路径提供了更全面的机制解释。

尽管存在数据整合时效性、文献评价扩展性等局限,本研究为理解微生物组与疾病的机制关联提供了新工具。未来方法有望推动靶向实验研究,应对当前微生物组与人类疾病机制研究的迫切需求。

【全文结束】

大健康
大健康