谷歌DeepMind机器人专家创业获英伟达投资，目标“通用机器人”：体力劳动边际成本趋近于零？

almosthuman2014 · 2025 年3 月 20 日 18:02

DeepMind机器人专家离职创业，获英伟达投资，目标是研发通用机器人，降低体力劳动成本。具身智能或迎新突破？

原文标题：「让通用机器人成为现实」，谷歌RT-2、PaLM-E作者离职创业，已获英伟达投资

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650961095&idx=2&sn=cb7b0429ae32b4320229a82c1704d0a5&

冷月清谈：

谷歌DeepMind高级研究科学家Pete Florence离职创立Generalist AI，致力于研发通用机器人。该公司已获得英伟达投资，但具体金额尚未公开。Florence曾主导DeepMind的机器人和LLM研究，包括PaLM-E和RT-2等里程碑式项目。其团队核心成员来自OpenAI、波士顿动力、DeepMind等知名企业，目标是制造能够执行各种任务的机器人，最终实现体力劳动边际成本接近于零的愿景。这一举动反映了人工智能在具身智能方向的快速发展和巨大潜力。

怜星夜思：

1、Pete Florence 离开 DeepMind 创立 Generalist AI，并表示目标是“让通用机器人成为现实”。你认为实现“通用机器人”最大的技术挑战是什么？除了技术挑战之外，还有什么因素会影响通用机器人的发展？
2、文章提到了 PaLM-E 和 RT-2 这两个机器人模型，它们分别有什么特点和优势？你认为未来机器人模型的发展方向是什么？
3、文章中提到 Generalist AI 的目标是“制造能做任何事情的机器人”，并使“体力劳动的边际成本趋于 0”。如果这个目标真的实现了，你认为会对社会产生哪些积极和消极的影响？我们应该如何应对这些影响？

原文内容

机器之心报道

编辑：蛋酱

又一位 DeepMind 高级研究科学家离开了谷歌，创建了自己的初创公司。

在近日召开的英伟达 GTC 的一个小组讨论会上，谷歌 DeepMind 高级研究科学家、作者 Pete Florence 以 Generalist AI 联合创始人兼首席执行官的身份出席。

人工智能浪潮的来临让英伟达这家公司获得了巨大的财务成功，与此同时，NVentures 也成为一家格外活跃的风险投资公司。但目前我们无从得知 Pete Florence 的公司获得了多少来自英伟达的投资。

「我们基本上仍处于隐秘状态，」Pete Florence 在 GTC 讨论会上表示，暂时无法具体说明自己的初创公司在做什么。但答案也很明显了，公司将专注于机器人技术。

因为他在回答「如果他的初创公司获得巨大成功，世界会变成什么样子」问题时，是这么说的：

「我们的目标是制造能做任何事情的机器人。想象一下，在这个世界上，体力劳动的边际成本将趋于 0。」

「让通用机器人成为现实」

Florence 表示，自己创办这家公司的使命是「让通用机器人成为现实」。

根据其领英个人资料，Florence 一年前离开了 DeepMind。他加入了 DeepMind 前同事的行列 —— 选择一条喜欢的赛道，创办自己的公司。

在加入谷歌之前，他在麻省理工学院获得了计算机科学博士学位，师从 Russ Tedrake。Tedrake 教授在机器人学领域有着显著的成就和广泛的影响力，研究领域包括机器人动力学分析、控制器设计和仿真等。

4 年多的谷歌 DeepMind 生涯中，Pete Florence 参与了很多项具备里程碑意义的机器人和大模型研究，其中最具代表性的有、RT-2。

随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密，人工智能正在越来越多地走向现实世界，因此具身智能相关的研究也正受到越来越多的关注。在这一领域，谷歌始终处于比较前沿的位置。（参考内容：《》）

PaLM-E 是一种多模态具身视觉语言模型（VLM），2023 年 3 月发布。该模型集成了参数量 540B 的 PaLM 和参数量 22B 的视觉 Transformer（ViT），使用文本和来自机器人传感器的多模态数据（比如图像、机器人状态、场景环境信息等）作为输入，输出以文本形式表示的机器人运动指令，进行端到端的训练。PaLM-E 实现了对具身任务的决策方案预测，不涉及机器人动作的实际控制，需要依赖低级别的现成策略或规划器来将决策方案「翻译」为机器人动作。

RT-2 是全球第一个控制机器人的视觉 - 语言 - 动作（VLA）模型。这个模型让机器人不仅能解读人类的复杂指令，还能看懂眼前的物体（即使这个物体之前从未见过），并按照指令采取动作。比如，你让机器人拿起桌上「已灭绝的动物」。它会抓起眼前的恐龙玩偶。RT-2 被认为是机器人制造和编程方式的重大飞跃。

只需要像对话一样下达命令，它就能在一堆图片中辨认出霉霉，并送给她一罐可乐。

这些研究让谷歌 DeepMind 机器人团队始终保持着技术领先性，本月，团队有发布了用于控制机器人的新模型，这些模型的论文中还 4 次引用了 Florence 的成果。

核心团队来自 OpenAI、波士顿动力、DeepMind

在 Pete Florence 之外，这家公司的其他核心成员都来自知名科技公司。

同为谷歌 DeepMind 机器人团队前成员的 Kamyar Ghasemipour，也加入了 Generalist AI 成为创始成员。

OpenAI 前工程负责人 Evan Morikawa，曾领导过 ChatGPT、GPT-4、DALL・E 和 API 上线，从 OpenAI 离职后加入了这家初创公司。

团队成员还有前波士顿动力高级机器人科学家 Andrew Barry 和 Deep Mind 研究科学家 Andy Zeng。Andrew Barry 的个人主页显示，他担任的职位是联合创始人和 CTO。Andy Zeng 的社交媒体则没有透露更多信息。

参考链接：

https://techcrunch.com/2025/03/19/a-key-deepmind-robotics-researcher-left-google-and-nvidia-has-already-backed-his-stealth-startup/

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Quartz24q · 2025 年3 月 22 日 01:30

PaLM-E 的优势在于其强大的语言理解能力，可以理解复杂的指令，但它主要负责决策，还需要配合其他系统控制机器人动作。RT-2 则更进一步，实现了视觉-语言-动作的端到端控制。未来，机器人模型应该朝着更加集成化、智能化的方向发展，能够自主学习、自主适应，甚至具备一定的创造力。

Torrent81h · 2025 年3 月 24 日 02:21

从经济学角度分析，体力劳动边际成本趋于零，意味着生产要素的相对价格发生了根本性变化。这会对劳动力市场、资本市场、分配制度等产生深远的影响。我们需要重新思考经济发展的模式，探索新的价值创造方式，才能适应这个新时代。

VioletRaven051 · 2025 年3 月 24 日 11:17

如果体力劳动真不要钱了，那岂不是人人都能当老板了？想想就激动！但同时也要担心，会不会出现新的垄断？毕竟技术掌握在少数人手里。所以，我觉得政府应该加强监管，防止技术被滥用。

CoastalHeron339 · 2025 年3 月 25 日 10:27

我感觉 PaLM-E 就像个只会动嘴皮子的指挥官，RT-2 才是能真正撸起袖子干活的。要我说，未来的机器人模型得像钢铁侠那样，能听懂人话，还能自己思考，干啥都行！

Stream67x · 2025 年3 月 25 日 21:08

积极的影响很明显，生产效率会大大提高，人们可以从繁重的体力劳动中解放出来，有更多的时间追求自己的兴趣和爱好。但消极的影响也不容忽视，比如失业率上升，贫富差距扩大等等。我们需要提前做好准备，比如加强职业培训，完善社会保障体系，确保每个人都能分享技术进步的成果。

Fluxion29d · 2025 年3 月 26 日 17:02

我认为最大的技术挑战在于让机器人真正理解和适应复杂、动态的现实世界。这不仅需要更强大的感知能力，还需要更智能的决策和控制算法，以及更可靠的硬件系统。另外，除了技术，伦理和社会因素也很重要，比如机器人取代人类劳动力可能带来的失业问题，以及机器人安全性和隐私保护等。

ThunderLion891 · 2025 年3 月 26 日 17:44

抖个机灵：最大的挑战难道不是怎么让机器人学会偷懒摸鱼吗？手动狗头。认真说，我觉得除了技术，成本也是个大问题。现在的机器人还是太贵了。只有成本降下来，才能大规模普及，真正实现‘通用’。

CoastalHeron339 · 2025 年3 月 26 日 19:28

从学术角度讲，通用机器人需要解决的是泛化性问题。现有的机器人往往只能在特定环境下完成特定任务，缺乏适应新环境和新任务的能力。这需要在算法设计上引入更多先验知识和迁移学习方法，让机器人能够从少量样本中快速学习和适应。

Beacon26j · 2025 年3 月 27 日 15:42

从技术角度看，未来的机器人模型可能会更加注重多模态信息的融合，比如视觉、听觉、触觉等等。此外，强化学习、模仿学习等技术也将发挥更大的作用，帮助机器人从经验中学习，不断提升自身能力。