斯坦福医学院研究人员开发了一种人工智能工具,帮助科学家更好地规划基因编辑实验。该技术CRISPR-GPT作为一种由AI支持的基因编辑"副驾驶",帮助研究人员——即使是那些对基因编辑不熟悉的人员——生成设计方案、分析数据和排查设计缺陷。
该模型建立在CRISPR这一强大基因编辑技术的基础上,CRISPR被用于编辑基因组和开发遗传疾病疗法。但对于实验设计的培训复杂且耗时——即使对经验丰富的科学家也是如此。CRISPR-GPT加速了这一过程,自动化了大部分实验设计和优化工作。领导该技术开发的病理学和遗传学助理教授Cong博士表示,其目标是帮助科学家更快地生产救命药物。
"我们的希望是CRISPR-GPT能帮助我们在几个月内而非数年内开发新药,"Cong说。"除了帮助学生、培训生和科学家共同工作外,拥有一个能加速实验的AI代理最终也可能挽救生命。"
此外,它还可能扩大能有效使用基因编辑技术的科学家群体——无需任何经验。例如,Cong实验室的一名学生首次尝试就成功使用CRISPR-GPT指导了在肺癌细胞中关闭几个基因的实验。这种成就通常需要长时间的试错过程。但Cong表示,AI工具能够降低CRISPR陡峭的学习曲线,似乎是向生物技术、农业和医疗行业开放基因编辑访问的有前景的方式。
"试错通常是科学培训的核心主题,"Cong说。"但如果它只是'尝试并完成'呢?"
Cong是7月30日发表在《自然·生物医学工程》上研究的高级作者。主要作者是癌症生物学研究生Yuanhao Qu和普林斯顿大学合作研究生Kaixuan Huang。Russ Altman博士实验室的研究人员也参与了这项研究,Altman博士是Kenneth Fong教授以及遗传学和生物医学数据科学教授。
像人类一样思考的AI
CRISPR可以靶向DNA片段并剪除有问题的突变——这是许多遗传疾病疗法(如镰状细胞贫血)的概念基础。但研究人员可能需要数月的猜测和验证工作来评估疑似DNA片段是否确实是需要切除的罪魁祸首。(CRISPR有时会意外编辑错误的基因序列,导致不需要的遗传效应。)
CRISPR-GPT利用多年已发表的数据,将实验设计优化为可能成功的方案。它还可以预测脱靶编辑及其造成损害的可能性,让专家选择最佳前进路径。
Cong的团队用11年的在线专家讨论(来自CRISPR实验)和科学论文中发表的信息训练了他们的模型。结果如何?一个"思考"像科学家一样的AI模型。
使用CRISPR-GPT时,研究人员通过文本聊天框与AI代理发起对话,提供实验目标、背景和相关基因序列。然后,CRISPR-GPT创建一个计划,建议实验方法,并识别类似实验中出现过的问题,帮助研究人员——新手或专家——避免这些问题。
试错通常是科学培训的核心主题。但如果它只是"尝试并完成"呢?
—Cong博士
清华大学访问本科生Yilong Zhou在研究癌症免疫疗法有时失败的原因时,使用CRISPR-GPT成功激活了A375黑色素瘤癌细胞中的基因。
Zhou在CRISPR-GPT的文本框中输入了他的问题:"我计划在人类肺细胞培养物中进行CRISPR激活,应该使用什么方法?"
CRISPR-GPT像一位经验丰富的实验室伙伴一样回答了新手研究人员。它草拟了实验设计,并在每一步解释了其"思考"过程,描述了各个步骤为何重要。
"当我对某些事情不理解时,我可以简单地提问,它会解释或调整设计以帮助我理解,"Zhou说。"使用CRISPR-GPT感觉不像是一个工具,而更像是一个随时可用的实验室伙伴。"
作为一名早期职业科学家,Zhou在使用CRISPR-GPT之前只设计过少量CRISPR实验。在这次实验中,他一次尝试就成功了——这对大多数科学家来说是罕见的。
过去,Zhou一直在担心犯错并反复检查他的设计。
减少错误并提高可及性
CRISPR-GPT可以在三种模式之间切换:初学者、专家和问答。初学者模式作为工具和教师,为每个建议提供答案和解释。专家模式更像是平等伙伴,与高级科学家合作解决复杂问题,不提供额外背景。任何研究人员都可以使用问答功能直接解决特定问题。
Cong说,它也有助于分享知识并与其它实验室合作。CRISPR-GPT提供的回应比通常从科学手稿中获得的更为详细和全面,并能迅速回应重复性询问。
CRISPR-GPT还可以检查研究人员的工作,并将实验框架应用于研究人员可能没有想到的新疾病。
"我实验室的人们发现这个工具非常有帮助,"Cong说。"最终决定由人类科学家做出,但它使从实验设计到执行的整个过程变得非常简单。"
负责任的编辑和未来扩展
虽然该技术有望加速治疗研究,但在更广泛推广CRISPR-GPT之前,仍有一些安全问题需要解决。
Cong和他的团队已经加入了保护措施,以防止AI工具被不负责任地使用。例如,如果AI收到协助不道德活动的请求(如编辑病毒或人类胚胎),CRISPR-GPT将向用户发出警告并显示错误消息,有效终止交互。Cong还计划将该技术带到政府机构,如国家标准与技术研究院,以确保道德使用和可靠的生物安全。
未来,该工具可能作为训练AI执行基因编辑以外特定生物任务的蓝图。从开发作为实验模型的新干细胞系,到破译心脏病涉及的分子途径,Cong希望将该技术扩展到其他学科,构建一系列AI代理以辅助基因组发现。为此,他和他的团队开发了Agent4Genomics网站,他们在那里托管一系列相关AI工具供科学家使用和探索。
谷歌DeepMind、普林斯顿大学和加州大学伯克利分校的研究人员为这项研究做出了贡献。
这项研究的资金来自美国国立卫生研究院(资助编号1R35HG011316和1R01GM1416)、Donald and Delia Baxter基金会教师学者奖、Weintz家族基金会和美国国家科学基金会。
【全文结束】