千寻智能人形机器人Moz1:探秘WAIC现场的“全能打工人”养成记

WAIC上,千寻智能人形机器人Moz1以其卓越的具身智能惊艳全场,预示未来机器人将深度融入生活与工作。

原文标题:WAIC机器人探展:我被全场最靓的崽「Moz1」种草了

原文作者:机器之心

冷月清谈:

一年一度的世界人工智能大会(WAIC)上,具身智能与人形机器人无疑是全场焦点。其中,本土新秀千寻智能携其最新研发的高精度全身力控人形机器人Moz1惊艳亮相,成功吸引了大量关注。Moz1不仅能像人类服务生一样精准取递饮料,还能完成太空步、S型极限压弯等高难度动态动作,并在精细操作如掌上迷宫、搭积木,以及处理柔性物体如叠衣服方面展现出卓越的灵活性和精准度。

千寻智能在技术上采取“脑体并进”的策略,即同步研发具身大模型与通用人形机器人本体。其核心技术是基于视觉-语言-动作(VLA)的自研大模型Spirit v1,该模型打通了感知、理解和执行链条,显著提升了机器人在复杂环境下的泛化与任务完成能力。Moz1作为Spirit v1的重要落地成果,具备了26个自由度、高功率密度一体化力控关节、国内领先的全身运动控制系统以及1:1的负载自重比,使其在办公室环境中能高效完成整理桌面、扔垃圾等多种任务。

该公司还建立了从数据采集到模型迭代的闭环系统,实现了软硬件的深度协同优化。在商业布局上,千寻智能致力于深入制造业和服务业等核心场景,以实际需求驱动技术研发和产品落地。得益于领先的全栈技术实力和具身智能赛道的巨大潜力,千寻智能在成立不到一年半的时间里获得了包括京东在内的多轮近6亿元融资,显示出资本市场对其未来发展的强烈看好。随着AI技术与硬件制造的结合,中国人形机器人企业正加速构建完整的生态闭环,预示着具身智能将从技术验证走向大规模商业应用。

怜星夜思:

1、文章里提到Moz1在办公室里能整理桌面、扔垃圾,还能擦黑板。除了这些演示功能,大家觉得未来像Moz1这样的人形机器人,在日常生活中或者特定专业领域,还能有哪些目前看似科幻但其实很有潜力的应用场景呢?
2、文章提到人形机器人发展飞速,但离大家都能用上可能还有距离。你们觉得,如果像Moz1这样的机器人未来要普及,最大的难点会是什么?除了技术本身,还有社会层面或者伦理方面需要解决的问题吗?
3、文章里说千寻智能用了VLA模型,实现了机器人的“脑体并进”。大家觉得未来5到10年,这种视觉-语言-动作一体化的大模型,会如何彻底改变我们和机器人的互动方式,甚至对我们的工作和生活产生哪些深远影响?

原文内容

机器之心报道

编辑:杜伟

一年一度的世界人工智能大会现场探展,我们被这个「闲不住」的人形机器人圈粉了。


2025 年行至过半,人工智能领域的前沿热点屡屡破圈,其中具身智能(Embodied AI)及其载体在国内格外受到了关注,尤其是人形机器人。


从年初春晚舞台上的扭秧歌转手绢、到四五月先后举办全球首届人形机器人马拉松比赛、全球首个人形机器人格斗大赛,得益于 AI 算法和机器学习等技术的进步,具身机器人展现出了越来越强的灵活性以及环境适应、感知决策行动能力。


在 2025 年世界人工智能大会(WAIC)现场,包括人形机器人在内的具身智能展区无疑是全场焦点。形态各异、「张牙舞爪」的各式机器人被现场观众围得水泄不通,它们乐此不疲,秀起看家本领。


其中,一家「忙碌中」的展台吸引了我们驻足,里面的人形机器人正像人类服务生一样,接受下单之后,从冰箱里取出饮料,并递给观众。


我们观察到,从识别到用户指令、到定位目标、再到抓取、递送饮料,全程一气呵成,完全由 VLA 模型自主推理实现,智能化程度令人叹为观止。



深入了解之后,我们发现,这是一家去年 2 月成立的具身智能创业公司「千寻智能。该公司致力于研发通用人形机器人和下一代具身大模型,缔造新一代智慧劳动力。


千寻智能展台上的这款人形机器人正是该公司六月正式发布的「Moz1」,它是国内首个高精度全身力控的具身智能机器人,拥有 26 个自由度(不含灵巧手),一体化关节的功率密度比特斯拉人形机器人 Optimus 还高 15%,在速度、精度、安全性和仿生力控方面都达到了行业最高水平。


纸面实力如此强悍,Moz1 还能带来哪些惊喜?在千寻智能展台,我们见识到了它更多惊艳的技能。


人形机器人 Moz1「秀翻」WAIC 全场


在 WAIC 现场,机器人带来的震撼几乎时时都在上演。


我们首先来到了千寻智能 Moz1 的运动控制区


在这里,Moz1 正在展示其卓越的整机协调性、动态平衡性、动作稳定性、智能规划等多个关键维度的核心能力。


看,Moz1 秀起了太空步,全身随意动作但手臂拿水不撒:


图片


智能 S 型极限压弯也不在话下:


图片


由此可见,人形机器人在动态环境中的适应能力有了质的提升。


接下来走向遥操作区,Moz1 的人机协作能力一览无余。


在现场技术人员的指挥下大显身手,Moz1 玩起了掌上迷宫走珠:


图片


还能搭积木:


图片


秀起舞姿:


图片


这意味着,Moz1 在精细任务操作过程中的灵活性与精准度拉满了。


最后是机械臂叠衣区,柔性物体操作显然难不住它。


抓取、折叠、堆高, 乱衣秒变豆腐块:


图片


一番体验下来,最大的感受是:


如今的机器人不再满足只完成预设任务,还能根据环境变化做出智能决策,进行自我优化和调整,提升自身在真实环境与任务中的灵活性和应对效率。


一句话,人形机器人的进化速度正在超出我们的想象。对于千寻智能来说,支撑起这一切的背后是其全栈自研具身机器人技术以及软硬协同推进的体系化积累。


打造「脑体并进」通用机器人框架


从创立之初,千寻智能便以同时打造「下一代具身大模型与通用人形机器人」为目标,机器人大脑与本体并举。大模型负责学习与决策,机器人本体承担感知与执行,两者协同进化,打破软硬件脱节的行业通病,开发真正可泛化、落地的通用机器人。


其中,在模型层面采用端到端 VLA(视觉 - 语言 - 动作)技术路线,这也是近年来具身大模型领域的主流架构,如 Figure 的 Helix、1X 的 Redwood AI。通过打通感知、理解和执行三大关键环节,这一路线加速实现从理解世界到高效行动的「通才具身智能体」,显著提升机器人在真实世界的泛化与任务完成能力。


千寻智能瞄准了通用机器人的这一现实可行落地框架,并于今年 3 月发布了自研的 VLA 模型 Spirit v1,在适应复杂多变环境和多样化任务连续操作方面实现了代际跃升。如 WAIC 现场展示的那样,该 AI 模型赋能的机械臂在国内首次实现叠衣服的全流程顺畅操作,一举攻克柔性物体长程操作这一行业难题。


此后,Spirit v1 持续迭代升级,探索并验证在更多真实任务场景中的实用性与鲁棒性。上个月发布的全力控人形机器人 Moz1 便搭载了该自研模型,这也是其在机器人本体层面的重要落地成果,标志着从「脑」到「体」的闭环系统已具备实战部署能力。


在强大泛化能力的加持下,Moz1 可以精准完成桌面整理、扔垃圾、座椅归位、擦黑板等办公室多场景任务,适应性越来越强,俨然一副「打杂小能手」的样子。


图片

整理桌面


图片

扔垃圾


图片

座椅归位


图片

擦黑板


可以预见,随着 Moz1 积累更多真实世界的交互经验,可以为后续承担更高复杂度的协作任务打下基础。未来,Moz1 有望从「能干活」进化到「会思考」,成为办公环境中的全能助理将不再只是梦想。


Moz1「集多能力于一身」


当然,除了软件层面高度智能化、自主化的大脑之外,Moz1 同样在硬件领域实现了多项突破性进展,为其「行为像人」做足了工程落地上的准备。包括如下:


  • 全身配置 26 个自由度,赋予 Moz1 更强的灵活性和操作范围,胜任精细化、多姿态任务;

  • 搭载全球功率密度最高的一体化力控关节,实现高输出、高响应动力表现,并兼顾轻量化与紧凑结构;

  • 国内领先的高精高速 WBC(全身运动控制)系统,优化手脚联动、躯干配合等复杂动作规划;

  • 负载自重比达 1:1,与自身重量相当的负载能力使其在实际任务中具备更强实用性。


配合性能强大且深度融合的大小脑,Moz1 实现了多模态感知交互与全身协同。此外,Moz1 还做到了全身零延时遥操作,配合自研的多维度数采设备,能够高效完成数据采集,并支撑模型小时级迭代。这样一来,Moz1 从一台单纯的执行机器化身为「边干边学」的数据闭环系统。


种种软硬件突破,贯穿从算法模型到本体设计、从运动控制到任务执行的全栈式优化,使得 Moz1 具备了第一梯队实力。这种「AI 模型进化 + 硬件性能突破」的深度协同模式,构筑起了千寻智能在具身智能赛道的核心技术壁垒和差异化优势


Spirit v1 以及 Moz1,是千寻智能成立一年多来交出的一份优秀答卷。未来,千寻智能一方面继续探索 VLA 模型与机器人本体在更多复杂环境与真实任务中的深度耦合与协同演进,进一步提升系统的泛化能力与执行稳定性。


另一方面,在商业化布局上以需求为导向,深入制造业、服务业等上百个核心场景(如办公场景、家庭场景)展开调研,瞄准真实产业痛点并转化为产品定义的核心参数,形成「场景需求 — 技术攻关 — 产品落地 — 市场反馈」的闭环开发逻辑,推动具身智能从技术验证走向大规模商业应用。


而作为行业少有的兼备「自研大模型、机器人本体、场景落地」全链路能力的创企,千寻智能的这种前瞻性布局,既契合了行业对机器人高度灵活性、通用性和自适应性的需求,并朝着更智能、跨场景应用方向演进。


资本持续加码,押注的不只是技术


ChatGPT 推出以来,除了大模型,资本也在寻找下一个爆点,其中能够理解世界、进行推理并执行任务的具身机器人被认为有望掀起下一波 AI 浪潮。


最后一两年,在国内,无论是宇树机器人这样的顶流明星,还是千寻智能、智元机器人、星动纪元等具身智能新势力,都受到了资本的高度青睐与追捧,进入到一个融资集中爆发期。


就以千寻智能来说,成立不到一年半的时间,这家具身智能新秀凭借行业领先的 AI + 机器人全栈技术实力,先后完成了多轮融资,包括这周官宣的近 6 亿元 PreA + 轮融资,由京东领投,中网投、浙江省科创母基金、华泰紫金、复星锐正等知名机构跟投。同时顺为资本、华控基金等老股东追加了投资。


一众资本对千寻智能的高度认可,靠的不单单是其领先的大模型技术和成熟的机器人产品,具身智能的赛道红利以及创始团队的影响同样不可忽视。


据此前高盛预测,到 2035 年,全球人形机器人市场规模有望达到 1540 亿美元。这意味着巨大的增量市场空间等着包括中国在内全球机器人玩家挖掘,资本持续看涨在意料之中。


不久前,英伟达 CEO 黄仁勋在参加第三届链博会期间,表示他对中国机器人发展非常乐观,「中国拥有三大独特优势,包括卓越的人工智能技术、擅长机电一体化、大规模制造业基地提供庞大的潜在市场」。老黄的这番言论一定程度上道出了中国在具身智能领域迅速崛起的原因。


随着大模型与机器人深度融合,像千寻智能这样的本土机器人企业凭借 AI 技术的积累、强大的硬件制造能力和丰富的应用场景,正在形成从底层技术到终端产品的完整生态闭环。加上创始人兼 CEO 韩峰涛、联合创始人高阳与郑灵茵拥有的丰富全球市场实践经验,形成「技术研发 — 产品量产 — 市场验证」全链路,在具身智能赛道的激烈竞争中走出一条高效的成长路径。


届时,人形机器人在形态和技能上又会玩出什么新花样,我们拭目以待。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

针对第二个问题:我觉得成本和维护费用绝对是绕不过去的大山啊!现在看这种高端机器人,价格肯定不菲,离寻常百姓家能接受的价格还差得远。就算买得起,后期机器人的维修、保养、软件升级这些,估计也是一笔不小的开销。技术再牛、概念再好,要是用不起或者用起来太麻烦,那就很难大规模普及起来。

针对第三个问题:我觉得最最显著的变化就是人机交互会变得极其自然和无缝。不再需要复杂的编程或者固定的指令集,我们直接用日常语言甚至一个眼神、一个手势,机器人就能理解并执行。比如,随口一句“帮我把那个散落在桌上的文件整理一下”,它就能准确识别意图并完成,这种自然的协作方式会大大提升效率,让机器人成为真正的“智能伙伴”,而不是一个被生硬操控的工具。

回答第三个问题:随着VLA模型的深度进化,机器人将不再是单纯的执行者,而是能参与到更具创造性和协作性的工作中去。它们能理解更抽象的概念,通过观察和模仿人类学习新技能,甚至与我们共同完成设计、艺术创作,或者进行复杂的科学实验。人与机器的边界会进一步模糊,形成真正的“人机共生”工作模式,人类可以把精力集中在更高层次的思考和创新上,而重复性、具象化的工作则交给它们。

回答第二个问题:我最担心的是就业冲击和安全伦理问题。如果人形机器人真能替代那么多岗位,那被取代的劳动力怎么办?社会如何消化这些失业人口?政府需要提前做好规划。另外,机器人的行动安全也得摆在首位。即便有各种安全协议,万一出现算法bug或者程序出错导致伤人事件,谁来负责?这些都需要完善的法律法规来约束和保障,否则大家心里都会有顾虑。

回答第一个问题:我反而觉得,高危作业领域才是人形机器人的终极归宿吧。比如核电站检修、危险品处理、地震灾害救援、甚至去一些人类难以进入的极端环境进行探测和维修。人类进去太危险,但机器人不怕辐射、不怕高温高压,还能执行精细操作,这才是真正发挥它们高精度力控的优势,保护人类安全。

关于那个应用场景的问题:我倒是觉得,个性化教育和娱乐市场可能会先爆发一波。想象一下,一个能陪孩子玩、给孩子讲故事、教跳舞、甚至作为私人教练辅导运动的人形机器人,不比现在那些只能播视频的早教机强百倍?人形的交互感更强,也更有趣,能激发孩子的兴趣,让学习和娱乐不再枯燥,而且还能定制专属课程呢!

针对第一个问题:我觉得在养老看护领域潜力巨大啊!现在的养老院,其实人手是真不够,很多老人除了生活上的照护,也需要精神上的陪伴。机器人可以帮助递水、拿药、监测老人的健康状态,甚至陪着说说话,做些简单的康复训练。人形机器人比起固定在某处的机械臂,能提供更多情感上的交互,至少看起来更像个“伴儿”,对于老年人的心理健康也有帮助。

关于“脑体并进”的VLA模型影响嘛:我倒觉得它可能会带来更深层次的个性化服务和情感响应。机器人能通过视觉感知你的情绪,通过语言理解你的需求,甚至通过动作给你带来安慰。未来机器人可能会成为你专属的健身教练、学习导师,甚至一个可以倾诉的“家庭成员”。它会记住你的习惯、喜好,甚至能预测你的下一步需求,提供超出预期的服务。当然,这也可能带来新的伦理问题,比如对机器人的情感依赖,但从效率和便利性来说,肯定会有质的飞跃。

关于第二个问题:我觉得最深层的可能还是人类的心理接受度问题。我们看科幻片觉得很酷,但真要有个机器人整天在身边晃悠,会不会觉得有点“不真实”或“瘆得慌”?就是那种所谓的“恐怖谷效应”,机器人越像人,大家可能反而越警惕。建立人与机器人之间的信任感,消除大家对其潜在威胁的担忧,这会是个漫长的社会适应过程,可能比纯粹的技术突破还要复杂。