人形机器人「翻」战升级:波士顿动力 Atlas 迎战宇树、众擎,谁更胜一筹?

人形机器人“翻”战正酣!波士顿动力 Atlas 迎战宇树、众擎,侧空翻、前空翻各显神通。强化学习加持,未来已来?

原文标题:波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

原文作者:机器之心

冷月清谈:

宇树机器人率先发布人形机器人侧空翻视频,波士顿动力紧随其后发布 Atlas 视频,展示侧空翻等动作,引发网友热议。文章通过对比波士顿动力 Atlas 和宇树 G1 的侧空翻动作,指出 Atlas 依赖双手撑地,而 G1 可实现凌空侧空翻。文章还介绍了波士顿动力与 RAI Institute 合作,采用强化学习策略加速 Atlas 行为生成的过程,强调了强化学习在机器人领域的关键作用。

怜星夜思:

1、波士顿动力 Atlas 的“翻”更像“侧手翻”,宇树 G1 才是真正的“侧空翻”,你觉得这种区分重要吗?会影响人形机器人的发展方向吗?
2、文章提到强化学习在人形机器人中的应用,模拟器中训练 1.5 亿次,零样本迁移到硬件。你认为目前强化学习在机器人领域的应用还存在哪些挑战?
3、如果让你来设计一个人形机器人,除了“翻”这些花哨的动作,你认为最应该优先考虑哪些实用功能?

原文内容

机器之心报道

编辑:Panda、蛋酱

波士顿动力Atlas不语,只是一味双手撑地翻跟斗。


昨天,宇树机器人发布了一段视频,宣布首次让人形机器人实现了侧空翻,吸睛无数。

图片

而就在这段视频发出后不到 12 小时,波士顿动力也发布了一段视频,其中不仅同样演示了机器人侧空翻这一动作,还表演了其它看起来非常近似人类的动作。


网友惊呼:这是美国对宇树和众擎机器人的回应。

图片

也有网友表示,其动作的流畅程度超乎想象,更有人说 Atlas 的动作比作为人类的他还更加灵活。


到底行不行?咱们将动作分解开来看看:

视频一开始,机器人先表演了一个「没事儿走两步」,徐徐入场。

图片

掉转头,它突然开始加速跑:

图片

突然就开始阴暗爬行:

图片

之后又是一个好像有点站不稳的战术翻滚:

图片

请注意接下来这个向前翻的动作,Atlas 必须用双手撑住地面,才敢开始下一步动作:

图片

看了好几遍之后,总觉得哪里怪怪的,调成 0.5 倍速才发现,它只有下半身翻过来了,上半身还是原先的方向……

图片

对比前几天众擎家的「前空翻」:

图片

开始尬舞了,这似魔鬼的步伐:

图片

有人打趣道,它的霹雳舞动作至少不是世界上最糟糕的表演。你可能还记得,在去年的巴黎奥运会上,澳大利亚选手 Rachael Gunn 的「跳大神级」表演:

图片

最终,她获得了 9 位裁判中的 0 票支持,输掉了比赛却赢得了广泛的知名度。

如果我们将 Atlas 送上奥运赛场,Rachael Gunn 又该如何应对?

最后便是侧空翻,同样与宇树 G1 对比一下:

图片

图片

可以看到,波士顿动力 Altas 在执行侧空翻动作时同样使用了双手撑地这个动作(严格意义上这已经不能算是「空翻」,只能算是侧手翻),而 G1 则完全是凌空侧空翻。至少从这一点看,宇树 G1 要更胜一筹。

强化学习至关重要

波士顿动力表示,Atlas 演示的是「使用动作捕捉服开发的强化学习策略」。而该策略是波士顿动力与 RAI Institute 一起合作开发的,而后者的「使命是解决 AI 和机器人领域最重要和基本的难题」。


RAI Institute 则在自家 𝕏 帐号上分享了稍微更多一些细节。


这家公司表示,强化学习的作用是加速波士顿动力 Atlas 人形机器人的行为生成。其学习过程的核心是基于物理的模拟器 —— 它可以为各种动作生成训练数据。

比如匍匐前进:

图片

连续侧空翻 + 后空翻

图片

又或者举门而入(从这个模拟机器人扭动的情况看,这门应该挺重的):

图片

RAI Institute 表示其控制策略是通过跟踪和控制重新定位的人体运动数据构建的,并且每个动作都首先让模拟器运行了大约 1.5 亿次,并可以零样本地传输到硬件 —— 也就是说无需再在硬件上继续训练或调整。

图片

我们知道,现今推理模型的成功就离不开强化学习,而强化学习也已经开始在更多领域开疆拓土,比如蛋白质折叠和药物设计、芯片设计自动化等等。

对于这段视频预示的未来,你做好准备了吗?


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


挑战还是很多的。首先是模拟器的真实性问题,模拟环境再逼真,也不可能完全模拟真实世界的复杂性。其次是泛化能力问题,在模拟环境中训练好的模型,在真实环境中可能表现不佳。还有强化学习的训练效率问题,1.5 亿次训练听起来很多,不知道要花费多少时间和计算资源。

别忘了安全问题!在真实环境中,机器人可能会遇到各种意想不到的情况,比如突然出现的障碍物、意外跌倒等等。如果机器人没有足够的安全机制,很可能会对自己或者周围的人造成伤害。所以,如何保证机器人在复杂环境中的安全性,也是一个重要的挑战。

我觉得最大的挑战是如何设计合适的奖励函数。奖励函数决定了机器人学习的方向,如果奖励函数设计得不好,机器人可能会学到一些奇奇怪怪的行为。比如,为了获得更高的奖励,机器人可能会选择作弊或者绕过一些限制条件。这需要大量的实验和调试才能找到最佳方案。

如果是我设计,我希望能赋予它情感理解能力!这样它才能更好地与人互动,提供更个性化的服务。例如,它可以识别用户的情绪,然后给出安慰或者建议。当然,这需要大量的研究和开发,但我觉得这才是未来人形机器人的发展方向。

大家都在卷“翻”,但我觉得更应该关注这些“翻”背后的技术积累。无论是哪种“翻”,都需要强大的算法和硬件支持。这种高难度的动作,对于平衡性、稳定性和控制精度的要求都非常高。所以我觉得区分重要,但更重要的是看到背后的技术进步。

我觉的应该考虑负重能力和稳定性吧。能搬运重物,而且走起路来稳稳当当的,这才是人形机器人的基本功啊!别老想着花里胡哨的表演,先把干活的本领练好再说。

我觉得挺重要的。虽然都是“翻”,但体现了不同的技术路线。Atlas 这种更偏向于控制和力量,G1 则是更纯粹的运动能力。如果未来人形机器人要应用到复杂地形或者需要高机动性的场景,G1 这种可能更有优势。

区分当然重要啦!这就像武侠小说里的招式,名字好听不好听,决定了它的江湖地位!“侧手翻”听起来就low了嘛。不过话说回来,实用性也很重要,如果“侧手翻”更稳更安全,落地更可靠,那也未尝不可。

我觉得最应该提升的是感知能力。让机器人能够像人一样,准确地识别周围环境,理解人类的指令,并且能够根据环境的变化做出相应的反应。只有具备了强大的感知能力,人形机器人才能真正融入人类社会,为我们提供更好的服务。