在西班牙马德里OXO电子游戏博物馆拍摄的《毁灭战士》经典游戏画面。
埃杜阿尔多·帕拉/欧罗巴通讯社 via 盖蒂图片社
澳大利亚生物技术公司皮质实验室(Cortical Labs)近期发布了一段视频,展示其硅芯片上培养的20万个活体人类神经元成功操作1993年第一人称射击游戏《毁灭战士》。受神经元控制的角色在走廊中穿行、遭遇敌人并开火射击——尽管操作笨拙且频繁死亡,但神经元确实在进行游戏。
此次演示可能标志着真正的转折点。皮质实验室首席科学官布雷特·卡根(Brett Kagan)指出,这些神经元展现出他所称的“适应性实时目标导向学习”能力。其意义远超游戏领域,尤其考虑到人工智能的电力消耗正急剧增长。虽然神经元不太可能取代微芯片,但它们能以更高效率执行某些计算,相关研究或为计算技术乃至神经药物测试开辟新途径。
需要明确的是,皮质实验室的神经细胞并非直接提取自大脑。“本质上可取少量血液或皮肤组织,”卡根解释道,“分离特定细胞转化为干细胞,再由这些干细胞生成无限量的神经细胞。”每个计算单元可容纳约80万个神经元,其自维持生命支持系统能维持细胞存活长达六个月。该接口依赖电力运作——卡根称之为“生物学与硅基技术的共同语言”。当脑细胞活跃时会产生微小电脉冲,系统亦可向其反馈微弱电脉冲。
但建立连接只是基础环节,难点在于让培养皿中的细胞执行特定任务。“人们容易拟人化认为它们‘喜欢玩《毁灭战士》’,”卡根表示,“但这是套系统,既非动物、人类甚至昆虫。如同问‘计算机是否喜欢强化学习模型的奖励函数?’”
激励神经元的解决方案源自伦敦大学学院神经科学家卡尔·弗里斯顿(Karl Friston)提出的自由能原理。该原理认为神经系统会主动预测环境变化。“若我伸手取空饮料罐并准确预判动作结果,这便是一个可生存的世界,”卡根解释,“但若有时它变成鸡有时变成烟花,这样的世界将无法生存。”
研究团队构建了简易反馈回路进行训练:错误操作产生随机不可预测信号(白噪音),正确操作产生结构化可预测信号。“细胞无法预测的任何信号都将成为其必须规避的对象,”卡根强调,“因为这是在环境中建立可预测性的唯一途径。”本质上,混沌即惩罚,秩序即奖励。
2022年10月,皮质实验室在《神经元》期刊发表概念验证研究。卡根团队证明芯片神经元能在数分钟内学会操作经典游戏《乓》——玩家需拦截弹跳方块的二维乒乓球游戏。但《乓》仅涉及简单移动线条,而《毁灭战士》包含走廊、敌人、三维导航及多重致死威胁。
为实现技术跨越,皮质实验室联合斯坦福大学举办黑客马拉松。独立研究员肖恩·科尔(Sean Cole)将神经元与标准学习算法结合,混合系统性能超越纯算法运行效果——表明生物细胞确实参与了学习过程。
皮质实验室将发展目标分为两大方向。医疗方向上,卡根指出:“神经精神类药物临床试验失败率高达93%-99%。”当前药物测试多在信息真空中的神经元进行,但他强调:“脑细胞本不该处于信息隔绝状态。我们已发表研究证明,当细胞处于游戏或模拟环境时,其药物反应及疾病表现存在根本差异。”
计算方向上,卡根认为:“神经元构成我们已知最强大的信息处理系统,其复杂度远超硅基技术。”硅晶体管仅具一阶复杂度(0和1二进制状态),而“生物神经元至少具备三阶复杂度,可能更高。它们能同时维持三个动态交互状态。”
印第安纳大学布卢明顿分校副教授冯国(Feng Guo)在2023年《自然·电子学》论文中提出利用三维脑类器官计算的“Brainoware”系统。他认为皮质实验室的生物计算平台具备“高级计算能力”,且能效论证最具决定性:“人脑仅耗电20瓦——低于一盏昏暗灯泡。若用硅基AI系统实现同等算力,能耗至少高出百万倍。”
卡根谨慎避免过度宣传前景:“口袋计算器做长除法永远比我快,但最先进的强化学习AI算法,仍不如人类去别人家找到泡茶方法来得高效。”他将生物计算定义为“智能工具箱中的新工具”。短期内不会出现培养皿脑驱动的个人电脑,但卡根表示:“当问题可被研究时,科幻便转化为科学。”数年前生物计算仅有《乓》游戏成果,如今已拥有商用平台、开发者可接入的应用程序接口,以及神经元在《毁灭战士》中蹒跚前行的视频——尽管表现拙劣,但它们正在学习。
【全文结束】

