原文标题:Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?
原文作者:机器之心
冷月清谈:
-
加州大学伯克利分校的研究团队在Sergey Levine的带领下,一直是具身智能领域的重要参与者。
-
Cross-Embodiment 受到关注,即尝试训练单一的策略或模型来控制不同形态和功能的机器人。
-
数据集匮乏 是具身智能研究中的长期挑战,因此构建具有更大规模和更多样性的数据集至关重要。
-
多模态能力 也是研究热点,例如视觉-语言-动作多模态能力。
亮点研究
-
Pushing the Limits of Cross-Embodiment Learning for Manipulation and Navigation 提出通过跨实体学习来实现机器人操作和导航的策略,训练一个单一的目标条件策略,能够控制机械臂、四旋翼飞行器、四足动物和移动底座。
-
Octo: An Open-Source Generalist Robot Policy 提出基于 Transformer 的开源通用机器人策略 Octo,能够处理多种机器人平台和任务。
-
Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation 提出 CrossFormer 模型,能够处理操纵、导航、行走和飞行等任务的数据。
-
DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset 构建了比 Open X-Embodiment 涵盖更多场景的数据集,包含 76k 个示范轨迹,跨足 564 个场景、86 项任务和 52 座建筑。
-
SOAR: Self-Supervised Learning of Robot Manipulation Skills Using Language and Vision 提出利用 VLM 来让机器人自主收集数据并学习技能的方法。
怜星夜思:
2、文中提到的DROID数据集已经相当庞大,你认为构建更大的数据集是否有必要?如果需要,构建更大数据集的难点和价值分别是什么?
3、你认为文中提到的SOAR方法是否有可能成为解决具身智能数据匮乏问题的关键?
原文内容
机器之心PRO · 会员通讯 Week 35
---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----
1. Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?
Sergey Levine近期研究了哪些具身课题?Cross-Embodiment 能解决数据类型繁杂问题吗?DROID 比 Open X-Embodiment还好用吗?VLA 现在更好用了吗?...
消费者近期在用哪些 GenAI 应用?哪种类型的应用更受欢迎?新流行的AI应用如何交互?当前热门的AI应用有哪些核心/差异化功能?用户的使用体验如何?...
3. 红衫资本合伙人最新访谈:AI 时代的三大关键因素是服务器、钢铁和电力
David Cahn 对 AI 下阶段有哪些观点?为何高额的资本支出是科技巨头加剧垄断的手法?为什么 David Cahn 认为服务器、钢铁和电力才是推动人工智能领域进步的关键因素?...
...本期完整版通讯含 3 项专题解读 + 28 项本周 AI & Robotics 赛道要事速递,其中技术方面 8 项,国内方面 7 项,国外方面 13 项。
要事解读① Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?
1、Sergey Levine 是加州大学伯克利分校(UC Berkeley)电气工程与计算机科学系助理教授,专注于研究让自主智能体通过学习获得复杂行为的通用算法,集中在机器学习决策和控制领域。
① UC Berkeley 是具身智能重镇之一,旗下有伯克利机器人学习实验室、机器人 AI 和学习实验室、伯克利人工智能实验室、交互式自主与协作实验室等顶尖研究组。
② Sergey Levine 是 UC Berkeley 在具身智能领域的代表人物之一,同样知名的还有 Pieter Abbeel 教授、Trevor Darrell 教授和 Anca Dragan 教授等。
③ 2024 年 3 月,Sergey Levine 和 Karol Hausman 以及 Chelsea Finn 等知名研究者成立了具身智能创业公司 Physical Intelligence(PI),并获得了 7000 万美元投资。[1]
2、Sergey Levine 长期保持较高的论文发布频率,其谷歌学术引用量超过 13 万,在顶会和期刊上的论文接收量也长期位居前列。
3、2024 年 1 月至 8 月底,2024 年 1 月至 8 月期间,Sergey Levine 团队参与了大量具身智能相关研究,于 arxiv 上发布 50+篇论文。
① 在涉及具身智能主题的论文近半,其中许多工作都在尝试从不同的角度解决数据匮乏,以及提高训练中数据的利用效果。
② 在发布的论文中,除了关注具身智能长期存在的数据问题,不少工作还在探索 Cross-Embodiment,尝试用单一的策略或模型来控制不同的机器人,也有工作关注 VLA,探索机器人学习中更强的视觉-语言-动作多模态能力。
