随着全球癌症病例增加,癌症疾病的复杂性也不断提高,对诊断和治疗的科学进展提出了挑战。在此背景下,人工智能 (AI) 成为预测和检测癌症的重要工具。
巴西和波兰研究人员开发的一种新工具可能有助于这一过程。他们的研究成果发表在期刊 Cell Genomics 上。
这种机器学习模型可以通过识别特定蛋白质预测某些肿瘤的侵袭性。它生成一个从 0 到 1 的干性指数,其中 0 表示侵袭性较低,1 表示侵袭性较高。随着指数升高,癌症趋于更具侵袭性、耐药性和复发可能性更高。
干性程度表明肿瘤细胞与多能干细胞的相似程度,后者几乎可以转化为人体内的任何细胞类型。随着疾病发展,恶性细胞会逐渐失去其原始组织特征。这些细胞具有自我更新能力,并表现出未分化表型。
科学家利用临床蛋白质组肿瘤分析联盟 (CPTAC) 提供的 11 种癌症数据集开发了这一工具,并由此建立了基于蛋白质表达的干性指数 (PROTsi)。他们分析了超过 1,300 个样本,包括乳腺癌、卵巢癌、肺癌(鳞状细胞癌和腺癌)、肾癌、子宫癌、脑癌(儿童和成人)、头颈癌、结肠癌和胰腺癌。
通过将 PROTsi 与来自 207 个多能干细胞的蛋白质组数据整合,研究团队识别出驱动某些肿瘤侵袭性的蛋白质。这些分子可能是新型广谱或特异性疗法的潜在靶点。因此,该工具不仅有助于推动治疗的临床发展,还促进了癌症治疗的个性化。
“许多这些蛋白质已经是市场上已有抗癌药物和其他疾病药物的作用靶点。它们可以在未来的研究中基于这一识别结果进行测试。我们通过将干性表型与肿瘤侵袭性关联得出了这些结论。”巴西圣保罗大学里贝朗普雷图医学院(FMRP-USP)多组学与分子肿瘤学实验室教授 Tathiane Malta 向 Agência FAPESP 解释道。
Malta 是这篇文章的通讯作者之一,另一位是来自波兰波兹南医科大学的 Maciej Wiznerowicz 教授。Wiznerowicz 教授曾于 2022 年获得一项旨在促进和认可女性参与科学的奖项,以表彰她多年的工作成果。
2018 年,她是发表在 Cell 杂志上的一篇文章的第一作者,该文章是她博士后研究的成果。在这篇文章中,她的团队开发了一个干性指数,能够客观衡量肿瘤样本与多能干细胞之间的相似性。
“当时,我们使用美国癌症基因组图谱计划维护的公共肿瘤数据库开发了基于机器学习的算法。我们依赖于基因表达数据(RNA 定量)以及表观基因组数据(DNA 甲基化)。如今,我们使用基于蛋白质组学的 CPTAC 数据库,并更新了我们的工作,专注于蛋白质这一功能性分子,它可以直接应用于治疗可能性和临床应用。”Malta 补充道。
根据目前取得的结果,PROTsi 与之前发表的转录组衍生的干性评分呈正相关,包括 2018 年的模型。例如,PROTsi 在区分肿瘤和非肿瘤样本方面表现更佳。
Renan Santos Simões 是 Malta 的导师,也是该文章的共同第一作者之一,另一名共同第一作者是来自波兰波兹南国际分子肿瘤研究所的 Iga Kołodziejczak-Guglas。Simões 表示,在描述干性特征并考虑蛋白质水平及其修饰方面的进展,为深入了解肿瘤进展和当前疗法的耐药机制打开了新的大门。
“科学进步缓慢而谨慎,是由许多人共同努力构建的。令人欣慰的是,我们正在为这一进程做出贡献。这正是激励我们的动力:知道我们今天所做的工作,能够真正改善患者的生活,提升治疗效果和生活质量。”Simões 说道。此外,同样作为 Malta 学生的巴西研究人员 Emerson de Souza Santos 也参与了这项研究。
在最近的 2 月 4 日世界癌症日,世界卫生组织 (WHO) 发出警告称,全球每分钟有 40 人被诊断患有癌症并需要治疗。
肿瘤已成为主要死亡原因之一,尤其影响年轻人群。一项 2023 年发表在 BMJ Oncology 上的研究显示,1990 至 2019 年间,50 岁以下成年人早期癌症发病率上升了 79%,癌症死亡率增加了 28%。该研究涵盖了 204 个国家的 29 种癌症。
巴西国家癌症研究所 (INCA) 预计,2023 至 2025 年期间,每年将新增约 704,000 例癌症病例。根据《2023 年估计——巴西癌症发病率》,最常见的恶性肿瘤依次是非黑色素瘤皮肤癌(占总病例的 31%),其次是女性乳腺癌(10.5%)、前列腺癌(10%)、结直肠癌(6.5%)、肺癌(4.6%)和胃癌(3%)。
在验证过程中,PROTsi 在多个数据集中表现出一致的性能。它清楚地区分了干细胞和分化细胞,不同肿瘤则落在不同的中间水平。例如,在子宫癌和头颈癌案例中,PROTsi 显示出良好的预测能力。
此外,该工具在区分腺癌、子宫癌、胰腺癌和儿童脑癌样本中的高级别肿瘤方面更为有效。
“我们试图建立一个适用于所有癌症的模型,但发现它在某些癌症类型中表现更好。我们将提供一个数据源供未来研究使用。”Malta 表示。
据该教授介绍,圣保罗大学团队正在测试其他计算模型,以期进一步提高预测准确性。
更多信息:
Iga Kołodziejczak-Guglas 等人,《基于蛋白质组的干性评分测量肿瘤去分化并识别可药物干预的目标》,Cell Genomics (2025)。DOI: 10.1016/j.xgen.2025.100851
期刊信息:
Cell Genomics, Cell
本文由 FAPESP 提供。
【全文结束】


