通过观看经验丰富的外科医生的手术视频,一台机器人首次成功执行了与人类医生同样熟练的手术程序。这一突破性的训练系统利用了模仿学习,开启了医疗机器人领域的新篇章。研究结果由约翰霍普金斯大学的研究人员领导,并将在慕尼黑举行的机器人学习会议上进行展示,这是机器人和机器学习领域的顶级活动之一。
“这真的非常神奇,我们只需要给这个模型输入摄像头数据,它就能预测出手术所需的机器人动作。”该研究的资深作者、约翰霍普金斯大学机械工程系助理教授Axel Krieger说,“我们认为这标志着向医疗机器人新前沿迈出的重要一步。”
研究团队包括斯坦福大学的研究人员,他们使用模仿学习来训练达芬奇手术系统机器人执行手术中所需的三个基本任务:操纵针头、提起身体组织和缝合。在每种情况下,机器人根据团队的模型执行的手术程序与人类医生一样熟练。
该模型结合了模仿学习与支持ChatGPT的相同机器学习架构。然而,与ChatGPT处理文字和文本不同,该模型使用运动学语言,将机器人的运动角度分解为数学表达。
研究人员向模型输入了数百段记录自达芬奇机器人手臂上的腕部摄像头拍摄的手术视频。这些视频由世界各地的外科医生录制,用于术后分析并归档。全球近7000台达芬奇机器人被使用,超过50000名外科医生接受了该系统的培训,从而为机器人提供了大量可“模仿”的数据。
尽管达芬奇系统广泛使用,但研究人员表示,它以其不精确著称。然而,研究团队找到了一种方法使这种有缺陷的输入发挥作用。关键在于训练模型执行相对运动而不是绝对动作,后者是不准确的。
“我们只需要图像输入,然后这个AI系统就能找到正确的动作。”该研究的主要作者、约翰霍普金斯大学的博士后研究员Ji Woong “Brian” Kim说,“我们发现,即使只有几百个示范案例,模型也能学会手术程序并在未遇到的新环境中进行泛化。”
“我们认为这标志着向医疗机器人新前沿迈出的重要一步。”Axel Krieger补充道:“这个模型在学习我们未教过的事情方面表现得非常好。例如,如果它掉了针头,它会自动捡起来并继续操作。这不是我教它做的。”
研究人员表示,该模型可以快速训练机器人执行任何类型的手术程序。目前,团队正在使用模仿学习训练机器人不仅执行小的手术任务,而是进行完整的手术。
在此之前,编程机器人执行即使是手术的一个简单部分也需要手动编码每一个步骤。有人可能需要花费十年时间来建模缝合过程,Krieger说。而那只是针对一种手术的缝合。
“这非常局限。”Krieger说,“这里的新颖之处在于,我们只需要收集不同手术程序的模仿学习数据,就可以在几天内训练机器人学会这些程序。这使我们能够加速实现自主目标,同时减少医疗错误并实现更准确的手术。”
来自约翰霍普金斯大学的作者包括博士生Samuel Schmidgall、副研究工程师Anton Deguet和机械工程系副教授Marin Kobilarov。斯坦福大学的作者包括博士生Tony Z. Zhao和助理教授Chelsea Finn。
(全文结束)


