梅奥诊所的研究人员开创了一种名为OmicsFootPrint的人工智能(AI)工具,该工具可以帮助将大量复杂的生物数据转换为二维圆形图像。Omics是指研究基因、蛋白质和其他分子数据,以揭示身体如何运作以及疾病如何发展。通过映射这些数据,OmicsFootPrint可能为临床医生和研究人员提供一种新的方式来可视化癌症和神经疾病等疾病中的模式,从而帮助指导个性化疗法。它还可能提供一种直观的方法来探索疾病机制和相互作用。
这项工具的详细信息已发表在《核酸研究》杂志上。“当您可以看到数据讲述的故事时,数据就变得最有力量”,该研究的主要作者、梅奥诊所个体化医学中心生物医学信息学副教授Krishna Rani Kalari博士说,“OmicsFootPrint可能会打开通往我们以前无法实现的新发现的大门。”
简化复杂数据
基因作为身体的指令手册,而蛋白质则执行这些指令以维持细胞功能。有时,这些指令的变化——称为突变——会破坏这一过程并导致疾病。OmicsFootPrint通过将基因活性、突变和蛋白质水平等数据转换为彩色圆形地图,帮助理解这些复杂性,从而更清楚地展示体内发生的情况。
在他们的研究中,研究人员使用OmicsFootPrint分析药物反应和癌症多组学数据。该工具在区分两种乳腺癌——小叶癌和导管癌——方面的平均准确率为87%。应用于肺癌时,它在识别腺癌和鳞状细胞癌两种类型方面表现出超过95%的准确性。
小数据集带来大影响
研究表明,结合多种类型的分子数据比仅使用一种数据类型产生更准确的结果。OmicsFootPrint还在有限的数据集中显示出提供有意义结果的潜力。它使用先进的AI方法,从现有数据中学习并将这些知识应用于新场景——这一过程被称为迁移学习。例如,在使用不到典型数据量20%的情况下,它帮助研究人员实现了超过95%的肺癌亚型识别准确率。
“这种方法对于样本量较小或临床研究可能是有益的”,Kalari博士说。
为了增强其准确性和见解,OmicsFootPrint框架还使用了一种称为SHAP(Shapley Additive Explanations)的先进方法。SHAP突出显示了影响结果的最重要标记、基因或蛋白质,帮助研究人员理解驱动疾病模式的因素。
从研究到临床实践
除了研究之外,OmicsFootPrint还设计用于临床应用。它将大型生物数据集压缩成只需原始存储空间2%的紧凑图像。这使得这些图像可以轻松集成到电子病历中,以指导未来的患者护理。研究团队计划扩展OmicsFootPrint以研究其他疾病,包括神经疾病和其他复杂疾病。他们还致力于更新工具,使其更加准确和灵活,包括发现新的疾病标志物和药物靶点。
(全文结束)


