具身智能的「猫步」与「盲触」:人形机器人技术挑战深度解析

“猫步”吸睛,人形机器人具身智能挑战何在?专家揭示灵巧触觉、平衡控制是核心难题。

原文标题:猫步已成,「具身智能」的技术难关还有「哪几重门」?

原文作者:机器之心

冷月清谈:

近期,小鹏机器人展示的稳定“猫步”引发业界对人形机器人的高度关注和资本热捧。然而,iRobot联合创始人Rodney Brooks指出,当前的“具身智能”机器人仍处于早期炒作阶段,技术挑战巨大。文章核心揭示了数个关键技术瓶颈:首先,机器人主要依赖视觉进行“端到端学习”,但缺乏人类细致的触觉反馈和实时力觉感知,导致其在复杂环境中难以实现灵巧操作。 其次,为维持平衡,机器人常使用强力电机和复杂算法,造成机身僵硬,一旦摔倒可能带来安全风险,如北京人形机器人马拉松的低完赛率所示。要让通用人形机器人真正从实验室走向实用,除了提升手部灵巧度、发展高密度触觉传感器外,还需在环境认知和动作规划等方面取得突破。业界正通过硬件改进、算法创新和结构调整来应对这些挑战。这指出人形机器人仍需在“理解身体”和“控制身体”两大核心能力上深耕,而非仅停留在动作模仿。

怜星夜思:

1、文章提到,人类手部约有1.7万个机械感受器赋予精细触觉,所以我们闭眼也能系鞋带。如果未来机器人真的能达到人类级别的触觉感知能力,你觉得它最先会被应用在哪些传统机器人难以胜任的领域,带来哪些颠覆性的改变?
2、文章提到北京人形机器人半程马拉松完赛率不高,暴露了机器人稳定性和能耗问题。在追求“像人”步态的同时,你觉得为了避免机器人过度僵硬和高能耗,未来的运动控制是该更偏向仿生优化,还是探索完全非人但可能更高效安全的运动模式?
3、文章中提到,资本市场对人形机器人的关注持续升温,而知名机器人学家Rodney Brooks却认为仍处在过早的炒作阶段。你认为在当前的这种发展阶段,资本的“狂热”或“催熟”对人形机器人技术发展是利大于弊,还是弊大于利?或者说,是否存在一个理想的平衡点?

原文内容

本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。

引言:近期,小鹏机器人以「猫步式」走法亮相,引发了业界对人形机器人技术成熟度的新讨论。越来越多的企业正以人形为切入口,聚焦灵巧手、柔性驱动和感知控制等方案,推动具身智能从可展示迈向可执行。但是,当算法只能支撑机器人展示通过遥操控执行模仿而来的执行动作,人形机器人还需突破哪些「技术挑战」才能获得「理解身体」、「控制身体」的能力呢?


目录

01. 「猫步亮相」成功,人形机器人算是走出了「万里征途」的第几步?

当端到端学习只能模仿动作,人形机器人如何获得「理解身体」的能力?...

02. 掌握「人类身法」,机器人运控近年玩出了哪些新花样?

仿人五指 or 夹爪并行,人形机器人该追求「像人」还是「能用」?RL 和力控结合的「学习型身体」,让人形机器人具备了人类的动作智能?...

03. 运控「交卷」之后,「具身智能」的技术难关还有「哪几重门」?

通用人形的未来,会从形态统一走向功能分化吗?...


「猫步亮相」成功,人形机器人算是走出了「万里征途」的第几步?

1、近期,小鹏发布了最新一代人形机器人 IRON ,在现场演示中该机器人步态稳定、姿态流畅,引发了全网热议。部分观众质疑 IRON 是「真人伪装」,后续小鹏拆解了机器人外壳,展示内部的机械结构已示证明。

2、这场高调的亮相让「人形化」的机器人进展再一次引发了公众热议。相对地,资本层面对于人形机器人的关注也一直在持续升温中。

3、从投入力度来看,2025 年前三季度,全球机器人初创公司募资已超 85 亿美元。[2-1]

① 其中,Figure 公司在近期获得了 10 亿美元 C 轮融资,投后估值高达 390 亿美元。

4、国内市场也同样处于狂热期,IT 桔子数据显示,2025 年前 5 个月融资额已达 232 亿元,已超过 2024 年全年总和。且据不完全统计,目前已有超 700 亿元产业基金助推人形机器人发展。[2-1]

5、在面对海量的市场资金投入时,知名机器人学家、iRobot 联合创始人 Rodney Brooks 却认为人形机器人仍处在过早的炒作阶段,人形也不是万能解。在资本的热捧与和对未来的幻想之外,怎样解决技术挑战是真正决定人形机器人未来发展的关键。[2-3]

6、他认为,今天的人形机器人在可预见的将来都难以学会人类双手的灵巧。当前的人形机器人几乎是「盲触」状态,只依赖摄像头视觉而缺乏实时力觉反馈,而「端到端学习」只能学习表面模仿动作,难以真正适应不可预测的真实环境。[2-3]

Brooks 指出,业内部分公司试图通过让机器人观看人类操作视频来进行端到端训练,但却忽略了灵巧操作中的触觉。

② 人类手部约有 1.7 万个机械感受器赋予了精细的触觉,所以正常人闭眼也能系鞋带、摸黑取物。但是如果将手指麻醉丧失触觉,再简单的点火柴动作都会变得笨拙艰难。

③ 他预测即使到 2036 年以后,可部署人形机器人的灵巧度和人手相比仍然是相形见绌。[2-4]

7、Brooks 也指出,为了模仿人类双脚在复杂环境中的行走,人形机器人多采用强力电机和复杂算法(如 ZMP 零力矩点平衡)来纠正姿态,失去稳定性后往往通过瞬时注入大量能量来强行稳住。[2-3]

8、虽然这样的主动控制降低了摔倒的频率,但也使机器人机身高度僵硬。且如果能量还没有释放完后就摔倒,其肢体将在失控中带来巨大的动能,给周围人员造成重击伤害。[2-3]

① Brooks 通过尺度分析指出,小型半人高机器人常被认为安全,可一旦放大到真人尺寸,质量将增至原来的 8 倍,储能需求相应飙升 8 倍。

② 今年 4 月举办的北京人形机器人半程马拉松中,共有 20 台人形机器人参与,结果仅 6 台完赛,结果仅 6 台完赛,14 台因关节过热或平衡系统崩溃中途倒下,完赛率不到 30%。[2-5]


掌握「人类身法」,机器人运控近年玩出了哪些新花样?

1、要让通用人形机器人从实验室走向实用,除了上述的灵巧操作手和双足稳定步行等运动控制层面的挑战外,还要面对环境认知、动作规划等困难,而目前业内研究者也从改进硬件设备、创新算法和调整结构等角度提出了不同的解决思路。

2、灵巧操作和手部触觉方面,人类手部有 27 个自由度,相比之下先进的机器人手通常只有 20 多个自由度,且高密度、小型化的触觉传感器仍不成熟。[2-6]

3、为了减少机器人手和人手的感知能力差距,业界开发了各种新型触觉传感器,让机器人具备像人一样「边感觉边调整」的精细操作能力...


 关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读 


更多往期专题解读内容,关注「机器之心PRO会员」服务号,点击菜单栏「收件箱」查看。

如果机器人能做到人类触觉水平,那最直接的突破口应该是在那些需要“手感”和“经验”的传统匠人领域。比如,陶瓷艺术品的制作、精细雕刻、文物修复,甚至是高级服装定制中的面料选择和剪裁。这些都极其依赖操作者的经验积累和对材料的细腻感知。机器人具备了这种能力后,不仅能实现自动化和标准化,更能将濒临失传的技艺通过数据化和学习保存下来,甚至超越人类极限,创造出精度更高、细节更丰富的作品,真正让技术成为艺术的延伸。

资本嘛,它什么时候不是希望捞一笔就跑?现在人形机器人这么热,资本当然看中了它的故事性,能吸引眼球。‘猫步’一亮,估值翻几倍,谁还管你那灵巧手啥时候能真正拧螺丝?问题是,一旦热情退却,技术瓶颈没能短期突破,这些资本会不会‘割韭菜’一样撤走,留下烂摊子?就像当年的‘共享经济’一样。所以我个人认为,弊大于利。真正的技术突破是靠科学家和工程师一点点实验出来的,不是靠资本吆喝出来的。资本催生了泡沫,但泡沫总会破裂。

我觉得资本的狂热虽然有风险,但整体上对人形机器人技术发展还是利大于弊的。你想啊,没有资本的推动,这些烧钱的技术怎么可能发展这么快?它能吸引顶尖人才,促使企业之间良性竞争,加速技术验证和商业化落地。虽然可能有些公司确实在‘画大饼’,但总有那么几家是认真搞技术的。正是因为有足够的资金支持,很多理论研究才有机会被实践出来。所以,只要我们有足够的技术判断力,能区分哪些是真技术,哪些是炒作,就能让这股资本力量更好地服务于人类进步。平衡点就在于,我们要让资本投入到真正能解决实际问题的技术上,而不是光图个新鲜。

哈哈,说到机器人触觉,我第一个想到的就是它去摸盲盒!以后再也不用纠结怎么才能摸到隐藏款了,机器人上手一摸,立马告诉你哪个是稀有款!还有啊,我觉得它在美食界肯定能大显身手,比如揉面团,能精确感知面团的筋道和湿度,做出更好吃的面点;或者当个品酒师,通过触碰酒瓶和酒杯的细微振动,感受酒的年份和品质。甚至可以给家里的宠物按摩,精准感知哪个位置最舒服,成为专业的“撸猫师”!

嗯,关于机器人步态的问题,我觉得可能要跳出‘像人’还是‘不像人’的框架。也许未来会出现一种‘适应性步态’,根据地形、任务和环境自适应调整。比如在平坦路面就使用低能耗的滑行或轮式模式,遇到复杂障碍物再灵活切换到仿生足式。更进一步,结合轻量化材料和更高效的驱动技术,让机器人本身的‘身体’就能吸收和储存能量,实现更自然的柔性运动,而不是仅仅依靠算法硬拉硬拽。说白了,就是机器人要从硬件底层就更聪明地‘理解’和‘利用’物理定律,而不是光靠软件层面去‘对抗’它们。

这个问题很有趣,如果机器人能拥有人类水平的触觉,我想它会颠覆很多对精细操作要求高的行业。首先是精密制造和微创医疗,机器人可以更精准地组装微小部件,或者在手术中提供前所未有的反馈。其次是服务业,例如护理老人或处理易碎品,机器人能像人手一样轻柔地握持和感知,大大提高其在人机交互中的安全性和信任度。农业领域也有潜力,例如识别作物成熟度或进行精细采摘。触觉的提升将使机器人真正从‘执行者’转变为‘感知者’和‘适应者’。

我个人觉得,机器人就没必要非得‘像人’走路。马拉松那个例子不就说明了吗,为了像人一样平衡,强行注入能量,结果就是能耗高、易损坏,还可能伤人。我们希望机器人能融入生活没错,但更重要的是‘好用’和‘安全’。如果一个四条腿的,甚至用轮子或者履带的机器人能更好地完成任务,更稳定、更省电,为什么非要让它学两只脚走路呢?未来的方向应该是多元化的,让机器人根据应用场景来选择最合适的运动模式,而不是被‘人形’的束缚住。

关于人形机器人的步态演进,我认为在仿生优化和非人高效模式之间,可能存在一个融合点而非截然二分。仿生优化有助于初期的人机交互接受度及在人类环境中运行的自然度,例如上下楼梯、开门等。然而,对于特定高效能任务,完全仿照人体结构可能并非最优解。未来的方向可能是基于任务需求,在躯干和主要关节设计上保持仿生特点,但在终端执行器或某些特定步态模式上,可探索更适应机器人自身物理特性和能量效率的非人模式。例如,类似轮式与足式混合的设计在特定场景下可能更优。关键在于如何通过学习型控制系统实现从人类步态的模仿到内在力学原理的理解,并在此基础上进行创新,以达到刚度与柔性、安全与效率的动态平衡。

资本的介入对任何前沿技术而言都是双刃剑。一方面,它提供了研发所需的大量资金、人才和资源,加速了技术的迭代和商业化进程,将设想变为现实。例如,AI领域的快速发展就离不开巨额投资。但另一方面,过度的资本炒作可能导致行业‘虚火’过旺,催生短视行为,迫使企业过度追求短期展示效果而非深层技术突破,甚至造成资源错配或‘泡沫’破裂。对于人形机器人这种横跨多学科、技术链条长且应用落地周期较长的领域,关键在于资本能否保持耐心,并且与技术发展规律相匹配,支持基础研究和长期投入。一个理想的平衡点可能在于,资本在初期给予足够的探索空间,但在后期评估时,应更侧重于技术壁垒、实际解决问题的能力而非仅仅是市场叙事和概念炒作。