前字节跳动AI专家加盟千寻智能,领衔具身智能大模型研发

前字节跳动AI专家解浚源加盟千寻智能,负责具身大模型研发,加速具身智能落地。行业人才争夺激烈,具身智能或迎来爆发。

原文标题:前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人

原文作者:机器之心

冷月清谈:

前字节跳动AI技术专家解浚源加盟具身智能公司千寻智能,担任具身智能部负责人,全面负责具身大模型的研发工作。解浚源在AI领域拥有丰富的经验,曾在知名开源项目mxnet中担任重要角色,并在亚马逊和字节跳动担任要职。千寻智能是国内领先的具身智能公司,在具身大模型、机器人和场景落地方面具有领先优势。解浚源的加入将为千寻智能注入强大的技术动力,加速具身智能的产业化进程。文章还提到具身智能正迎来“曙光时刻”,吸引了大量人才涌入,技术突破和人才优势是千寻智能迅速发展的关键,他们近期发布了Spirit v1 VLA抢先版demo,展示了机器人在柔性物体操作方面的能力。

怜星夜思:

1、解浚源的加入对千寻智能的具身智能技术发展会带来哪些具体的影响?除了技术层面,还可能在哪些方面助力千寻智能的发展?
2、文章中提到具身智能的核心价值在于让机器人真正理解物理世界,你认为目前具身智能在理解物理世界方面还存在哪些主要挑战?有哪些可能的解决方案?
3、千寻智能Spirit v1 VLA 抢先版 demo 展示了机器人叠衣服的全流程,你认为叠衣服这个看似简单的任务,对于具身智能来说有哪些难点?攻克这些难点对于具身智能的实际应用有哪些意义?

原文内容

机器之心发布

机器之心编辑部


近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。据悉,解浚源目前任职千寻智能具身智能部负责人,全面负责具身大模型的研发工作。


解浚源,本科毕业于中国科学技术大学,博士毕业于美国华盛顿大学。曾在 nips,eccv 等多个领域顶级会议发表论文,论文被引用超过一万次。他曾是知名开源项目 mxnet 的早期创立者之一和后期主要架构师,先后任职亚马逊资深科学家和字节跳动 AI 高级专家,在系统架构、机器学习算法和应用落地方面都有丰富的经验。

原字节跳动 AI 大将加盟具身智能头部公司

千寻智能是国内领先的具备 AI + 机器人全栈生产力级技术能力的具身智能公司,技术团队在具身大模型、机器人以及场景落地方面兼具领先性。创始人兼 CEO 韩峰涛在机器人行业拥有十余年经验。曾任珞石机器人联合创始人兼 CTO,组建了世界级水平的运控和算法研发团队。联合创始人高阳在美国加州大学伯克利分校获得博士学位,在强化学习、视觉语言模型(VLM)和机器人任务规划方面取得了多项突破性成果,其提出的 ViLa 和 CoPa 模型被广泛应用于全球领先的机器人项目。

AI 业内人士评价称,解浚源的加入将为千寻智能注入强大的技术动力。解源在 AI 领域的丰富经验,将帮助千寻智能的具身大模型实现更快的技术迭代和演进。

具身智能迎来 “曙光时刻”

具身智能正成为全球科技领域最火热的赛道之一。随着大模型技术的突破和应用场景的不断拓展,具身智能正从概念走向现实,展现出巨大的发展潜力。千寻智能凭借其在技术、人才和资本上的多重优势,正在加速推动这一领域的产业化进程。

“我曾经和很多业内的具身智能公司有过接触,加入千寻智能的原因是非常认可千寻的技术路径和可落地性。” 解浚源曾在社交媒体上表示,“大语言模型的快速发展为具身智能的落地提供了很好的基础,大家都觉得 5 年之后就能实现 AGI,但却普遍对具身智能真正落地的周期不置可否。我认为,具身智能已经迎来了曙光,可落地的高性能具身智能机器人正在向我们走来。” 

在他看来,具身智能的核心价值在于让机器人真正理解物理世界的摩擦力、惯性与材料形变,让 AI 真正进入物理世界并进行有实际价值的人机交互。这种技术突破带来的兴奋感远超过纯数字世界的优化。

千寻智能成立于 2024 年,成立仅一年就已完成多轮融资。在技术突破和人才优势的双重加持下,千寻智能也在迅速完成着具身模型的迭代。近期,千寻智能发布了 Spirit v1 VLA 抢先版 demo,视频一镜到底地展示了机器人叠衣服的全流程,从抓取、到折叠和堆高都显得非常流畅,也是国内首次攻克柔性物体长程操作难题。

人才争夺背后的战略卡位

根据 Gartner 发布的《2023 年 AI 技术成熟度评估》,具身智能技术正处于创新爆发期,相关企业研发投入增速迅猛。这一技术代际转换的关键节点,使得顶尖人才的战略布局成为影响行业格局的关键变量。

“许多自动驾驶领域的中高端人才正在向具身智能领域转移。” 中国科学院自动化所博士隋伟指出,“具身智能的发展速度比预想的要快,无论是人工智能技术还是硬件的发展都超出预期,具身智能真正落地的时间可能会比想象中更早。”

千寻智能创始人兼 CEO 韩峰涛也曾公开表示,未来三年内人才将成为具身智能领域的关键瓶颈。为此,千寻智能将持续发力优秀人才引进,通过构建强大的团队,加速技术研发与商业化落地。这种以顶尖人才为核心的战略布局,不仅为千寻智能在激烈的市场竞争中赢得了先机,也为整个具身智能行业的发展提供了新的方向和动力。

© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]


叠衣服这个事儿看着简单,其实对机器人的精细操作能力要求很高。首先,机器人要能准确抓取柔软的衣物,这涉及到视觉识别、力反馈控制等多个方面。其次,叠衣服需要一定的空间推理能力,机器人要能判断衣物的形状和大小,并规划合适的折叠步骤。我觉得,攻克这些难点,意味着具身智能可以更好地应用于家政服务、医疗护理等领域,真正解放人类的双手。

叠衣服的难点在于处理柔性物体和长程操作。柔性物体的形变难以预测,使得机器人的抓取和控制更加困难。而长程操作则需要机器人具备较强的规划能力和鲁棒性,以应对各种误差和干扰。攻克这些难点意味着具身智能在复杂环境下的适应性和可靠性得到了显著提升,为其在工业、农业等领域的应用奠定了基础。

现在机器人所谓的“理解物理世界”,很大程度上还是靠大量的数据训练和预设规则。比如,让机器人识别一个苹果很容易,但让它理解苹果为什么会掉下来,或者不同材质的苹果手感有什么不同,就很难了。我觉得,未来需要更多结合物理引擎和传感器技术,让机器人能够像人类一样通过触摸、观察等方式感知世界。

解的加入,关键在于他能把大模型和机器人更好地结合起来。之前很多具身智能公司都是在模仿人类行为,但缺乏真正理解物理世界的能力。解在AI算法和应用落地方面的经验,可以帮助千寻智能的机器人更好地理解和适应复杂环境,实现更高精度和更智能的人机交互。期待Spirit v2!

解浚源大佬的技术实力毋庸置疑,他在系统架构和机器学习算法方面的经验积累,应该能帮助千寻智能更快地迭代具身大模型,说不定能搞出更牛的机器人出来。而且,他在业内的影响力说不定也能吸引更多人才加入,毕竟现在具身智能这个赛道,人才就是核心竞争力啊!

最大的挑战还是数据!现在的数据集通常是静态的、理想化的,而真实世界充满了噪声、不确定性和变化。所以,我们需要更多高质量的、多样化的数据,以及更强大的数据增强技术,让机器人能够更好地适应真实世界的复杂环境。当然,算力也是个瓶颈。

从学术角度来看,具身智能目前在物理世界理解方面的主要挑战在于感知、推理和控制三个方面。感知方面,如何让机器人准确识别和理解复杂场景中的物体、关系和动态变化?推理方面,如何让机器人根据已有知识和经验进行预测和决策?控制方面,如何让机器人精确地执行动作并与环境进行交互?可能的解决方案包括:1)开发更先进的传感器和感知算法;2)构建更强大的物理模型和知识库;3)采用更有效的强化学习和模仿学习方法。

别小看叠衣服,这里面涉及到复杂的物理交互和策略规划。机器人不仅要“看”清楚衣服的样子,还要“感觉”到力度和角度,才能叠得又快又好。解决了这个问题,以后就可以让机器人完成更多需要精细操作的任务,比如给老人穿衣服、给病人喂药等等,想想就觉得很实用!

谢邀,个人认为解浚源的加入不仅仅是技术层面的提升。他在大厂的经验,可以帮助千寻智能在项目管理、团队协作等方面建立更完善的体系。此外,他在AI领域的声望也有助于千寻智能在行业内建立更高的知名度,更容易获得投资和合作机会。当然,最终还是要看实际的研发成果和市场表现。