人工智能如何教两足机器人 Cassie 跑和跳

发布时间:2024/3/18 来源:MIT Technology Review
强化学习可以帮助机器人解决他们以前从未尝试过的新任务
screenshot of a bipedal robot in lane 4 of an outdoor running track

如果您看过波士顿动力公司关于 机器人 奔跑、跳跃和跑酷的精彩视频,您可能会觉得机器人已经学会了惊人的敏捷。 事实上,这些机器人仍然是手工编码的,并且很难应对他们以前从未遇到过的新障碍。

然而,一种教机器人移动的新方法可以帮助通过反复试验来应对新场景,就像人类学习和适应不可预测的事件一样。  

研究人员使用一种称为强化学习的人工智能技术来帮助一个绰号为Cassie 的两足机器人 在不同的地形上跑 400 米,并进行立定跳远和跳高,而无需对每个动作进行明确的训练。 强化学习的工作原理是在人工智能试图实现目标时对其进行奖励或惩罚。 在这种情况下,该方法教会机器人在新场景中进行概括和响应,而不是像其前辈那样冻结。 

“我们希望突破机器人敏捷性的极限,”参与该项目的加州大学伯克利分校博士生李中宇说道,该项目尚未经过 同行评审 “高级目标是教机器人学习如何像人类一样进行各种动态运动。”

该团队使用模拟来训练 Cassie,这种方法可以显着缩短学习时间(从几年缩短到几周),并使机器人能够在现实世界中执行相同的技能,而无需进一步微调。

首先,他们训练控制卡西的神经网络从头开始掌握一项简单的技能,例如原地跳跃、向前行走或向前奔跑而不摔倒。 它是通过鼓励模仿所显示的动作来进行教学的,其中包括从人类收集的动作捕捉数据和演示所需动作的动画。

第一阶段完成后,团队向模型提供了新命令,鼓励机器人使用新的运动技能执行任务。 一旦它能够在模拟环境中熟练地执行新任务,他们就会通过一种称为任务随机化的方法使其训练的任务多样化。 

这使得机器人能够更好地应对意外情况。 例如,机器人能够在被皮带向侧面拉动的同时保持稳定的跑步步态。 “我们让机器人利用其观察到的历史并快速适应现实世界,”李说。

卡西在2分34秒内完成了400米跑,然后在跳远中跳了1.4米,无需额外训练。

研究人员现在正计划研究如何使用这种技术来训练配备机载摄像头的机器人。 俄勒冈州立大学计算机科学教授 Alan Fern 补充道,这比盲目完成动作更具挑战性,他帮助开发了 Cassie 机器人,但并未参与该项目。

他说:“该领域的下一个重要步骤是人形机器人,它们可以做真正的工作,规划活动,并以不仅仅是脚和地面之间相互作用的方式与物理世界实际互动。”