科学家表示,该AI研究引擎将能够解码大部分仍不明确的人类基因组,为新药发现和个性化医疗打开大门。
Sharon Wrobel是以色列时报的科技记者。
国家人类基因组研究所提供的一张未注明日期的图片显示了DNA测序仪的输出结果。
像ChatGPT这样能够创建类似人类创造力的复杂内容的人工智能程序的出现,是通过汇聚网上大量可用数据与高计算能力实现的。
如今,以色列谢巴医疗中心的科学家们已与美国芯片巨头Nvidia和纽约市的西奈山医院联手,创建大型语言模型(LLMs),使用与ChatGPT相同类型的技术,但训练数据是人体的生物语言,旨在更好地理解并治疗困扰我们的疾病。
"我们希望创建一种基因组学版的ChatGPT,让用户能够输入一个人的全基因组测序数据,并能够回答有关健康风险的问题,或者基于个人独特的基因构成,确定针对某种疾病的最佳药物或治疗方法,"数字创新ARC中心Sheba Impact的CEO Avner Halperin对比利时时报表示。
"这是一个令人惊叹的项目,它真正理解生命的力量,触及人体工作原理的核心,以及为什么我们每个人都有些微不同,"他说。
这三方合作伙伴正在启动一项雄心勃勃的三年期项目,投资数千万美元,创建一个利用生成式AI解码人类基因组(人类生命的遗传蓝图)的研究引擎,而人类基因组的大部分内容目前仍不明确。
该计划的发起人、谢巴癌症研究中心主任Gidi Rechavi教授表示,基因组研究引擎将能够识别将个人基因构成与疾病风险和治疗反应联系起来的模式和机制。
人类基因组——构建和维持人类的指令集——由32亿个DNA字符或字母组成。在过去二十年中,科学界在完整人类基因组测序方面取得了进展,但只有2%的人类DNA由蛋白质编码基因组成,而其余98%的功能难以用传统方法解释,Halperin称。
(从左至右,第一排:Nvidia首席技术官Michael Kagan;谢巴医疗中心主任Yitshak Kreiss教授;西奈山医学院Icahn的Alexander Charney博士。第二排从左:数字创新ARC中心Sheba Impact CEO Avner Halperin;谢巴医疗中心Gidi Rechavi教授。2025年11月18日。)谢巴主导的这项合作旨在通过大型语言模型和机器学习技术开始解码剩余98%的奥秘。Nvidia将提供计算能力和AI基础设施,谢巴和西奈山将提供科学和临床专业知识,汇集并合成大量基因组数据集。
"Halperin表示:"人类基因组由超过30亿个DNA字母组成,其中我们只了解2%的功能和运作方式。如果医生需要为抑郁症开药或为特定癌症用药,大多通过试错过程,因为我们尚未弄清楚如何阅读和使用98%的基因组代码。"
该项目将汇集临床医生、遗传学家、生物信息学家和AI研究人员,利用Nvidia的计算能力、基础设施和算法,在数百万个数据点上将基因变异与疾病风险和治疗反应联系起来。
Nvidia应用AI架构部门的Dr. Nati Daniel和Dr. Yoli Shavit在一份声明中表示:"AI有能力解锁人类基因组的秘密,并为全球数十亿人改变医疗保健。"
Nvidia在以色列的研发活动是该公司在美国以外最大的研发活动。Nvidia的许多高端处理器和网络芯片(对训练最大AI模型至关重要)在其以色列研发中心开发。
Halperin表示:"如果这个项目成功,我们将能够为人们的特定基因需求开发治疗和药物,既用于预防医学,也用于选择合适的干预措施。制药公司将利用它开发个性化药物,医院将用它来调整治疗并以比当前方法更高的准确性选择药物。"
【全文结束】


