人类之手令人惊叹,机器人为何难以匹敌Human hands are astonishing tools. Here's why robots are struggling to match them

环球医讯 / AI与医疗健康来源:www.bbc.com英国 - 英语2025-01-21 23:00:00 - 阅读时长11分钟 - 5077字
本文探讨了人类手部的复杂性和机器人技术在模仿这种复杂性方面所面临的挑战,介绍了最新的AI驱动的仿生手臂和其他机器人技术的发展,以及它们如何逐渐接近甚至超越人类手部的功能。
人类手机器人灵活性假肢人工智能肌电触觉感受器康复软果采摘DEX-EE具身AI灵巧度任务执行感知反馈安全伦理老年人护理制造业农业劳动力短缺
人类之手令人惊叹,机器人为何难以匹敌

人类的手是令人惊叹的工具。为什么机器人难以匹敌?

我们的手每天执行数千项复杂的任务——人工智能能否帮助机器人匹敌这些非凡的人体部位?

人类的手是身体中最复杂且生理结构最精细的部分之一。它拥有超过30块肌肉、27个关节,以及由韧带和肌腱组成的网络,赋予其27个自由度。仅手掌就有超过17,000个触觉感受器和神经末梢。这些特性使我们的手能够通过各种不同的运动执行一系列高度复杂的任务。

但你无需告诉莎拉·德·拉加尔德(Sarah de Lagarde)这些。2022年8月,她刚刚攀登乞力马扎罗山归来,身体状况极佳。然而一个月后,她发现自己躺在医院病床上,遭受着可怕的伤害。

在从伦敦High Barnet车站回家的路上,德·拉加尔德不慎滑倒,跌入地铁列车与站台之间。被离站的列车和随后进站的另一辆列车挤压后,她失去了右臂(肩部以下)和部分右腿。

经过漫长的康复过程,英国国民医疗服务体系(NHS)为她提供了一只假肢手臂,但这只手臂几乎没有正常的活动能力。它似乎更注重外观而非功能。“它看起来不像真的手臂,”她说,“孩子们觉得它很吓人。”

这只假肢只有肘部的一个关节,而手本身则是一个静态的物体。九个月来,她难以完成以前习以为常的日常任务,直到她得到了一件改变生活的设备——一种利用人工智能(AI)通过检测微弱的肌肉电信号来预测她想要的动作的电池供电仿生手臂。

“每次我做动作,它都会学习,”德·拉加尔德说。“机器学会识别模式,最终演变成生成式AI,开始预测我的下一个动作。”

即使像用笔这样简单的事情,也需要手指和大脑之间的无缝协作,才能将其调整到书写位置。我们几乎不假思索就能完成的手部任务,实际上需要精确的运动控制和感官反馈相结合——无论是开门还是弹钢琴。

由于这种复杂性,几个世纪以来,医学专家和工程师们一直未能创造出能匹敌人类手部灵活性和多功能性的装置。从16世纪德国骑士使用的原始弹簧加载铁手,到20世纪60年代南斯拉夫创造的第一个具有感觉反馈的机器人手,都没有达到人类手部的自然能力。直到现在。

AI的进步正在带来一批能够接近人类灵巧度的机器。智能假肢,如德·拉加尔德所获得的那种,可以预见并优化运动。软果采摘机器人可以在田间摘取草莓,并将其轻轻放入其他浆果中而不压坏它们。视觉引导的机器人甚至可以从反应堆中提取核废料。但是,它们真的能与人类手部的惊人能力竞争吗?

具身AI

我最近迎来了第一个孩子。她一出生,小手就温柔地缠绕在我伴侣的食指上。尽管她的视力还只能聚焦在几英寸远的地方,她的手和手臂动作大多限于当物体放在掌中时会抓握的非自愿反射。这是一个可爱的例子,展示了我们在生命早期的灵巧敏感性——也暗示了随着我们成长,这种能力会如何提高。

在未来几个月里,我女儿的视力将发展到足以提供深度感知,同时大脑的运动皮层也会发育,使她对四肢有更多控制。她的非自愿抓握将让位于更刻意的抓取动作,双手向大脑发送信号,让她在感受和探索周围世界时进行精细调整。要达到成人水平的手部灵巧度,我的女儿需要几年的努力、尝试、错误和玩耍。

就像婴儿学习如何使用他们的手一样,灵巧的机器人利用具身AI遵循类似的路径。这样的机器人必须与人类共存于一个环境中,并基于先前的经验学习如何执行物理任务。它们会对环境做出反应,并根据这些互动微调运动。试错在这个过程中起着重要作用。

“传统AI处理信息,而具身AI感知、理解和回应物理世界,”佛罗里达大学土木工程教授杜敬京(Eric Jing Du)说。“这本质上赋予了机器人‘看见’和‘感受’周围环境的能力,使它们能够以类似人类的方式执行动作。”

但这项技术仍处于起步阶段。人类的感觉系统非常复杂,感知能力非常敏锐,以至于在灵巧度上复制人类手部的能力仍然是一个巨大的挑战。

“人类的感觉系统可以检测到细微的变化,并迅速适应任务和环境的变化,”杜说。“它们整合了多种感官输入,如视觉、触觉和温度。目前,机器人缺乏这种级别的集成感官知觉。”

但这种复杂性正在迅速增加。例如,影子机器人公司(Shadow Robot Company)与谷歌DeepMind合作开发的DEX-EE机器人是一只三指机器人手,使用类似肌腱的驱动器实现12个自由度。它专为“灵巧操作研究”设计,背后的团队希望展示物理交互如何有助于学习和发展一般智能。

每个手指尖端都装有传感器,提供实时三维数据,包括环境信息、位置、力和惯性。该设备可以处理和操作脆弱的物体,如鸡蛋和充气气球,而不会损坏它们。它甚至学会了握手——这要求它对外部干扰和不可预测的情况作出反应。目前,DEX-EE只是一个研究工具,尚未部署在真实工作场景中与人类互动。

了解如何执行此类功能对于机器人与人们一起工作和生活至关重要。例如,机器人应该多大力度抓住老年人患者,以便将他们搬到床上?

机器人的崛起

机器人学家一直梦想制造具有人类般灵巧度的自动化装置,以执行不受欢迎、危险或重复的任务。伯明翰大学机器人学教授鲁斯塔姆·斯托尔金(Rustam Stolkin)领导的一个项目旨在开发能够处理能源行业核废料的高度灵巧AI控制机器人。虽然这项工作通常使用远程控制机器人,但斯托尔金正在开发自主视觉引导机器人,可以在人类无法冒险的地方工作。

即使是最先进的机器人手臂也难以匹敌人类手的灵活性和适应性(图片来源:Estudio Santa Rita)

也许最著名的现实世界类人机器人是波士顿动力公司的类人机器人阿特拉斯(Atlas),它在2013年凭借出色的运动能力吸引了全世界的目光。最新一代阿特拉斯于2024年底推出,结合了计算机视觉和强化学习(一种通过反馈帮助AI系统变得更好的AI形式)。据波士顿动力公司称,这使得机器人能够执行复杂的任务,如包装或整理货架上的物品。

然而,麻省理工学院电气工程与计算机科学系副教授普尔基特·阿格拉瓦尔(Pulkit Agrawal)表示,机器人要在人类主导的行业中(如制造业、建筑业和医疗保健业)执行许多任务所需的技能仍然面临挑战。

“这是因为这些行业中大多数手部动作不仅需要精确的动作,还需要对不可预测的因素(如不规则的物体形状、不同的纹理和动态环境条件)作出适应性反应,”他说。

阿格拉瓦尔和他的同事正在开发使用具身AI学习运动技能的高灵巧建筑机器人。

目前,大多数机器人接受特定任务的训练,一次一个任务,这意味着它们难以适应新情况或不可预测的情况。这限制了它们的应用。但杜认为这种情况正在改变。“最近的进展表明,机器人最终可能会学习灵活多样的技能,使它们能够在没有事先特定训练的情况下处理各种任务,”他说。

特斯拉也在2024年底为其人形机器人Optimus配备了新手,工程师们发布了一段视频,显示机器人在空中接住网球。然而,它是通过远程手动控制而不是自主操作的。工程师们声称,这只手有25个自由度。

一些创新者试图在机器中重现人类的手和手臂,而另一些则选择了不同的灵巧方法。剑桥的机器人公司Dogtooth Technologies开发了软果采摘机器人,具有高度灵巧的机械臂和精密夹爪,可以在与人类工人相同的速度下采摘和包装如草莓和覆盆子等易碎水果。

软果采摘机器人的想法来自联合创始人兼首席执行官邓肯·罗伯逊(Duncan Robertson)在摩洛哥海滩上休息时。他想用机器学习和计算机视觉技能清理海滩垃圾,创建一种低成本的机器人来识别、分类和移除垃圾。回国后,他将同样的逻辑应用于软果农业。

这些机器人使用机器学习模型来部署我们人类本能掌握的一些技能。每只机器人的两个机械臂各配备两个彩色摄像头,类似于眼睛,可以识别浆果的成熟度,并确定目标果实与末端“效应器”(即抓取装置)之间的距离。

机器人绘制植物上成熟果实的分布和排列图,并将其转换为一系列动作,需要精确的路径规划,以引导采摘臂到达果实的茎处进行切割。

Dogtooth的机器人机械臂各有七个自由度,与人类手臂相同,意味着这些附肢可以灵活地找到最佳角度,以接触每个浆果而不损害仍在植物上的其他浆果。抓取装置然后轻轻地握住果实的茎,将其送入检查室,再小心地放入盒中分发。

虽然我们本能地知道需要多大的力量才能处理草莓而不压坏它,但机器人要达到同样的灵巧度却花费了几十年的研究和开发。罗伯茨强调,他的公司的机器人并不是取代人类劳动者,而是可以帮助解决农业行业中面临的劳动力短缺问题,允许人类和机器共同收获。

能够处理一些由人类执行的更细致任务的机器人可以为许多工业部门提供重要支持,麻省理工学院电气工程与计算机科学系副教授普尔基特·阿格拉瓦尔(Pulkit Agrawal)说。

“仅在美国制造业中,一些估计预测将出现两百万以上的劳动力短缺,”阿格拉瓦尔说,他正在开发能够操纵物体的机器。“无论是在工业应用、搜救、太空探索还是帮助老年人,AI驱动的机器人技术的影响将是变革性的——在我看来,比ChatGPT的影响更大。”

在一天的过程中,人类的手执行数千种不同的任务,适应处理各种不同的形状、大小和材料。机器人要在这方面赶上还有很长的路要走。一项最近对使用开源组件成本不到5,000美元(4,000英镑)的机器人手的测试发现,它可以被训练在空中重新定向物体。然而,面对具有挑战性的物体——例如橡胶鸭玩具——机器人仍然会在大约56%的时间内笨拙地掉落它。

预测的假肢

然而,机器人灵巧度的终极应用可能是假肢——例如,替代因事故或疾病失去的人类手。莎拉·德·拉加尔德(Sarah de Lagarde)获得的开创性肌电假肢手臂和手给出了未来可能的样子。

这种假肢是由多个软件和硬件公司合作开发的,使用肌电模式识别或神经意图解码,这是一种机器学习形式,使她的手能够学习她的动作并根据过去的行为做出预测。这意味着德·拉加尔德可以更本能地移动她的手。

“嵌入在莎拉假肢手臂中的硬件记录她在想象某个动作时皮肤表面的肌肉信号,”Coapt的首席执行官布莱尔·洛克(Blair Lock)说,该公司开发了驱动德·拉加尔德手臂运动的AI算法。这种硬件解码那些肌肉信号,以猜测德·拉加尔德想要用手做什么动作。“模式识别模型可以检测确定动作的强度、速度和力度。它可以在不到25毫秒的时间内执行命令,”洛克补充道。

德·拉加尔德将这个过程比作使用游戏控制器,在屏幕上召唤特定的反应。起初,她发现很难多任务处理,因为所有注意力都集中在肩膀上正确的肌肉纤维上。但最终,AI算法变得擅长预测她的意图,使她能够更容易地多任务处理。

“我可以指示它轻柔地触摸,以便拿起鸡蛋而不压碎它,”德·拉加尔德说。“但与此同时,我可以增强抓握力,使它足够强大,以至于可以压碎一罐可乐。”

人工智能也被集成到与她的手臂配对的应用程序中,该应用程序根据之前的使用情况提供建议,以更优地使用手臂。尽管有了很大的改进,但假肢永远不会完全像德·拉加尔德原来的那只手臂那样好。它很重,在夏天容易出汗,而且需要每天充电。此外,她仍然有一些功能性障碍需要克服。

假肢中的触觉反馈机制仍然相当初级,德·拉加尔德主要依靠视觉来处理物体。她有时会忘记自己拿着东西,松开手让它掉到地上。

相比之下,人类的手使用手指和手掌上的触觉感受器网络来感知物体的位置,确定需要多大握力才能拿起它,并感知摩擦的变化。

嵌入式AI显然正在引领越来越灵巧的机器人和假肢的发展。然而,目前看来,这项技术仍有很长的路要走,才能完全匹敌或超越人体的奇妙设计。根据阿格拉瓦尔的说法,物理机器人硬件和软件方面仍然存在挑战。“虽然我们在过去几年取得了实质性进展,人类般的灵巧度似乎是可以实现的,但我们至少还有五年,甚至更长的时间,”他说。

即使灵巧度提高,还有其他因素需要考虑,杜指出。“安全是最重要的,”他注意到。“这包括物理安全,确保机器人系统不会对人类同事造成伤害;还包括系统安全,涉及AI算法中的强大故障保护和冗余,以防止故障或意外行为。”杜还提出了伦理方面的考虑,如对就业的影响。

对于德·拉加尔德来说,机器人手灵巧度的提高使她恢复了一些她以为已经失去的能力——简单的任务如为自己倒一杯水,用两只胳膊拥抱孩子。

当我问德·拉加尔德希望看到这项技术的未来是什么样子时,她设想了一个未来,机器人身体增强不仅仅局限于肢体差异或残疾人士,还可以帮助老年人在晚年保持活跃。

尽管她可能不是自愿成为嵌入式AI的大使,但德·拉加尔德愿意接受这项技术,也为未来提供了可能性的一瞥。


(全文结束)

大健康
大健康