我始终觉得生物学家研究生命的方式很有趣。有句行内话是:生物学家会通过戳弄汽车、每次移除一个零件来理解汽车运作,而工程师则通过完全拆解重组来学习。人类基因组计划正是典型例证——我们花费十余年绘制30亿对碱基对的DNA序列,原以为通过逐个碱基修改就能根除疾病,结果却发现自己对DNA的真实功能知之甚少。
作为接受工程思维训练的AI研究者,我主张转变范式:不应局限于读取和解构DNA,而应创造它。我们将DNA视为语言系统,使AI能学习读写构建。基于这一理念,斯坦福大学与ARC研究所团队启动了"从零生成完整基因组"的登月计划。坦白说,最初我们不确定AI能否生成DNA——毕竟DNA如同带有语法结构的语言,30亿字符的长度使其容错率极低,单个字母错误就可能造成健康与致命疾病的差异。
为此,我与同事迈克尔·波利开发出突破性AI模型Evo。该系统使用80,000个完整基因组训练,生成DNA序列长度达现有模型500倍。我们将其比喻为DNA领域的ChatGPT——通过提示词生成特定DNA序列。但与文本生成不同,DNA功能验证需要生物实验。我们首先要求Evo从零生成CRISPR基因编辑系统,其蛋白质与RNA复合体结构通过实验室测试验证:当DNA双链被精准切割的两条亮线出现在凝胶电泳时,证实了AI生成序列的功能性。
更深远的应用正在展开:在个性化医疗领域,输入个体基因组即可预测药物反应;通过修正单个基因已实现镰状细胞病的永久治愈(目前500种DNA编辑疗法待批);Evo甚至尝试生成第24条人工染色体以对抗疾病。延伸至行星改造,科学家正设计耐极端环境的"地球火星改造微生物",这引发关于复活猛犸象(某公司计划2028年实现)与创造新物种的伦理讨论。
当然,技术双刃剑效应必须重视:AI既能生成高致病病毒,也可构建防御监测系统。作为研究者,我们需要在创新与安全间保持动态平衡——停止进步并不现实,而应随着技术进化建立监管框架。人类从观察生命到创造生命,正站在理解生物学的新起点:是进行微调编辑,还是撰写生命新篇章?答案将由我们共同构建的未来决定。
【全文结束】