佛罗里达大学研究人员开发AI工具解决精准医疗中的祖先偏倚问题UF researchers develop AI tool to tackle ancestral bias in precision medicine

环球医讯 / AI与医疗健康来源:www.news-medical.net美国 - 英语2025-03-10 22:00:00 - 阅读时长4分钟 - 1635字
佛罗里达大学的研究人员开发了一种名为PhyloFrame的机器学习工具,旨在解决遗传数据中的祖先偏倚问题,以提高精准医疗对所有人群的有效性。
佛罗里达大学AI工具PhyloFrame精准医疗祖先偏倚人类健康疾病预测诊断治疗遗传数据基因组数据库临床应用
佛罗里达大学研究人员开发AI工具解决精准医疗中的祖先偏倚问题

佛罗里达大学的研究人员正在解决医学遗传研究中的一个关键缺口——确保其更好地代表并惠及所有背景的人群。

这项工作由计算机与信息科学与工程系助理教授Kiley Graim博士领导,重点是通过解决遗传数据中的“祖先偏倚”问题来改善人类健康。这种偏倚出现在大多数研究基于单一祖先群体的数据时,Graim表示,这限制了精准医疗的进步,并使全球大部分人口在疾病治疗和预防方面得不到充分服务。

为了解决这一问题,该团队开发了PhyloFrame,这是一种利用人工智能考虑遗传数据中祖先多样性的机器学习工具。在国立卫生研究院的资金支持下,目标是改善疾病的预测、诊断和治疗,无论患者的祖先是何人。一篇描述PhyloFrame方法及其在精准医疗结果上显著改进的论文于周一在《自然通讯》杂志上发表。

Graim关注基因组数据中的祖先偏倚问题的灵感来自于与一位医生的对话,这位医生对他所研究的一个有限相关性的研究感到沮丧。这次交流促使她探索如何利用人工智能来弥合遗传研究中的差距。

“我当时想,‘我可以解决这个问题,’”Graim说,她的研究集中在机器学习和精准医疗,并接受过群体基因组学的培训。“如果我们的训练数据与现实世界的数据不匹配,我们可以使用机器学习来处理这种情况。这些方法并不完美,但可以大大解决这个问题。”

通过利用gnomAD人群基因组数据库的数据,PhyloFrame整合了大量健康人类基因组数据库和用于训练精准医疗模型的小型疾病特异性数据集。它创建的模型更能处理多样化的遗传背景。例如,它可以预测乳腺癌等疾病亚型之间的差异,并建议每种患者的最佳治疗方案,而不考虑患者的祖先。

处理如此大量的数据并非易事。该团队使用佛罗里达大学的HiPerGator超级计算机(全国最强大的超级计算机之一)来分析数百万人的基因组信息。对于每个人来说,这意味着处理30亿个碱基对的DNA。

“我没想到它会这么有效,”Graim说,她指出她的博士生Leslie Smith对此项研究做出了重大贡献。“这个项目最初只是一个小项目,使用简单的模型来展示纳入人群基因组数据的影响,现在已经发展到获得资金来开发更复杂的模型,并细化人群定义。”

PhyloFrame的独特之处在于它能够通过考虑与祖先相关的遗传差异来确保预测在不同人群中保持准确。这一点至关重要,因为目前大多数模型都是基于不能完全代表全球人口的数据构建的。现有的大部分数据来自研究医院和信任医疗系统的患者,这意味着小城镇的人群或那些不信任医疗系统的人群往往被排除在外,使得开发适用于所有人的治疗方法变得更加困难。

她还估计,97%的测序样本来自欧洲血统的人,主要是由于国家和州级的资金和优先事项,以及社会经济因素的影响——例如保险影响人们是否得到治疗,从而影响他们被测序的可能性。

“其他国家,尤其是中国和日本,最近也在努力缩小这一差距,因此这些国家的数据比以前更多,但仍无法与欧洲数据相比。较贫穷的人群通常被完全排除在外。”Kiley Graim博士说道。

多样性在训练数据中至关重要,Graim表示。

“我们希望这些模型能适用于任何患者,而不仅仅是我们研究中的患者,”她说。“拥有多样化的训练数据可以使模型对欧洲人也更好。拥有群体基因组数据有助于防止模型过拟合,这意味着它们将对所有人都更有效,包括欧洲人。”

Graim相信像PhyloFrame这样的工具最终将在临床环境中使用,取代传统模型,根据个人的基因组成制定治疗计划。团队的下一步包括改进PhyloFrame,并将其应用扩展到更多疾病。

“我的梦想是通过这种机器学习方法推动精准医疗的发展,让人们能够早期诊断并接受对他们特别有效的治疗,且副作用最小,”她说。“在正确的时间为正确的人提供正确的治疗是我们追求的目标。”

Graim的项目获得了佛罗里达大学医学院研究办公室的AI2 Datathon资助,该资助旨在帮助研究人员和临床医生利用人工智能工具改善人类健康。


(全文结束)

大健康
大健康