Manifold AI的WorldScape模型力压群雄,登顶WorldScore榜首

Manifold AI 的 WorldScape 模型登顶 WorldScore,标志着国产世界模型在真实世界执行力上的突破,领跑世界动作模型新范式。

原文标题:力压李飞飞团队登顶WorldScore,黑马Manifold AI领跑世界动作模型新范式

原文作者:机器之心

冷月清谈:

Manifold AI 近期在世界模型领域动作频频,其研发的 WorldScape 模型在通用世界模型评测榜单 WorldScore 上力压李飞飞团队等竞争者,荣登榜首。该模型在物理和交互指标上表现出色,超越了传统世界模型的视觉表象,触及了底层物理逻辑。此外,WorldScape 模型还具备高效的空间智能密度,参数规模远小于其他领先模型。Manifold AI 还联合国内外高校推出了面向具身世界模型的统一评测体系 WorldArena,推动世界模型从视觉逼真向功能可用转型。该公司专注于研发具备物理真实的世界模型和具身智能应用,并已获得多家顶级创投和产业投资的青睐。

怜星夜思:

1、WorldScape 模型在物理和交互指标上表现突出,这对于机器人和自动驾驶等应用场景意味着什么?未来是否会加速这些领域的智能化发展?
2、Manifold AI 强调“生成”与“控制”的深度融合,并引入了三维几何感知的空间表示与约束。这种技术思路会给其他世界模型研究者带来哪些启发?是否代表着未来世界模型发展的方向?
3、Manifold AI 成立仅 10 个月就获得 5 轮融资,且创始人团队背景强大。你认为他们在技术研发和商业落地方面有哪些优势?他们的快速发展对国内其他 AI 创业公司有哪些借鉴意义?

原文内容

图片
机器之心编辑部

通用世界模型评测榜单 WorldScore 登顶、建立具身世界模型评测榜单 WorldArena 、发布通用世界模型 WorldScape 、发布世界-动作模型 WorldScape Policy ,这家低调的世界模型创业公司 Manifold AI(流形空间)近期走出隐身模式频频出手,开始领跑世界-动作模型具身新路线。


力压李飞飞团队

登顶通用世界模型榜单 WorldScore


近日,国际权威榜单 WorldScore迎来更新,Manifold AI自研模型 WorldScape 强势登顶,在全球同台竞技中拿下第一。



在世界模型的全球竞逐中,国际权威榜单 WorldScore 被公认为检验通用世界模型基座实力的终极试金石。该基准从各类可控性、生成质量等多类维度,考验模型在数千个不同场景的生成能力,对模型进行严苛的极限测试。


面对这一高门槛,团队研发的 WorldScape 模型强势突围,总分稳居全球榜首。与其同场竞技的包括李飞飞团队、MIT、阿里、Runway、智谱、MiniMax、腾讯混元等。


WorldScore世界模型评测兼具深度与广度


长久以来,世界模型的通病是“重渲染、轻规律”,生成的视频看似精美,但在涉及复杂场景的运动、多步控制时,往往破绽百出。WorldScape 恰恰在最难攻克的物理和交互指标上,拉开了显著的领先优势,从而成功登顶。


这意味着,WorldScape 已经成功跨越了“像不像”的视觉表象,真正触及了“对不对”的底层物理逻辑。这不仅是一次分数的超越,更是国产世界模型在真实世界执行力上的一次标志性跨越。


更难能可贵的是,WorldScape 模型参数规模小于排名前列的其他模型一个量级,展现了该模型全球最高的空间智能密度



WorldScape 为什么能做到?答案是“生成”与“控制”的深度融合。


WorldScape核心架构图


全面领先的交互体验,而非单一交互WorldScape 通过统一的动作—世界状态建模框架,将空间位移与物体交互纳入同一生成过程,避免了多模块拼接带来的不一致问题,从而同时支持空间导航与物体操作。


更稳定、可信的三维世界结构WorldScape 在训练过程中显式引入三维几何感知的空间表示与约束,使生成结果在连续交互中保持一致的空间结构。这种设计有效缓解了长时生成中常见的几何漂移与结构崩塌问题。


实时生成下保持高视觉质量:在效率方面,WorldScape 并未简单依赖模型压缩或分辨率降低,而是通过结构化生成与高效训练策略,在单张 GPU 上实现接近实时(616 FPS)的交互式生成,并在成像质量、运动平滑度等视觉指标上位居前列,实现了速度与质量兼得的交互式生成。


具备“记忆”的世界:长期一致性是区分“视频生成模型”和“世界模型”的关键,WorldScape 通过几何感知的世界状态记忆机制,使模型能够在不同时间步之间共享和更新空间信息。


除了在国外已有的通用世界模型榜单登顶,Manifold AI 的联创团队也联合国内外十多所高校提出面向具身世界模型的统一评测体系 WorldArena ,并举办 CVPR 2026 WorldArena Challenge,推动世界模型从“视觉逼真”向“功能可用”转型。


近期国内外多家企业纷纷在这个具身世界模型的标准评测体系上进行了测试,成为具身世界模型领域的评测金标准。


Manifold AI 的联创团队也联合国内外十多所高校提出面向具身世界模型的统一评测体系 WorldArena。


最早专注于世界模型的公司


Manifold AI 成立于 2025 年 月底,聚焦于研发具备物理真实的世界模型和具身智能应用,也是国内第一家自研世界模型做为具身基础模型落地到机器人的创业公司。


虽然成立时间不久,但每次技术发布都颇具份量。



去年成立初期的几个月,Manifold AI 就发布了用于机器人的世界模型 RoboScape 和用于无人机的世界模型 AirScape,分别收录于计算机顶级会议 NeurIPS 和 ACM MM 


图片


正如官网的标语说的那样“ Better World Model For Better World ”, Manifold AI 相信世界模型不只是各个领域的应用模型,而是更好的基础模型会带来更强的泛化能力,带来物理 AI 各个应用场景的能力持续进化。


之后的几个月,他们聚焦在世界模型的基础设施的搭建和数据 Scaling,研发更加通用的基础世界模型。


今年年初,Manifold AI 发布了 WorldScape 世界模型,是世界范围内首个同时支持移动和操作交互的实时世界模型,并以此作为机器人的预训练基模。


今天登顶世界模型榜单 WorldScore 的正是 WorldScape v0.1 版本。而这只是一个开始,模型的能力正在快速地提升中。


图片
图片


同期,Manifold AI 也发布了 WorldScape Policy 具身世界-动作模型


WorldScape Policy 利用世界模型基模进行时空状态预测,并结合视觉输入进行空间内生推理从而执行动作,精度上全面超过现有 VLA 模型,具备少样本零样本执行能力。


图片
图片

 

Manifold AI 的初创团队有来自 Momenta、小鹏、元戎等自动驾驶领域的技术专家,他们深知固的基础设施是模型持续迭代的基础。


从第一天起,Manifold AI 就持续在基建方面投入,坚持硬件-数据-模型的闭环迭代,自主研发了从 Ego-CentricUMI、到 RL 采测一体等多种数采设备,搭建了模型驱动的数据管线,通过数据采集、数据过滤、数据增强、数据标注等环节持续产生规模化的高质量数据,日产能超过 10 万 clips 


概念未火时成立,10 个月斩获 轮融资


Manifold AI 成立于 2025 年 月底,昔时“世界模型”在国内资本圈还是个比较小众的概念,而随着 2025 年下半年 Google DeepMind 发布 Genie 3、李飞飞 World Labs 发布 RTFM 实时世界生成模型,越来越多的资本开始布道世界模型、发现国内居然已经有了这家可以对标海外顶尖团队的公司。


今天,公司宣布完成数亿元 Pre A+ 轮融资,由顺禧基金领投,银杏谷资本、金雨茂物、同创伟业跟投。其成立 10 个月已累计获得五轮融资,包括了君联资本等顶级创投和华为哈勃等知名产业投资。


这批黑马没有聘请外部 FA 机构,甚至没有专职融资员工,但资本市场的认可度侧面证明了其超前的技术判断力和扎实的研发成果。


创始人兼 CEO 武伟博士为前商汤科技高管,2015 年加入商汤初创,有数百人的团队管理经验,早在 2023 年开始就主导了商汤世界模型的研发和落地,曾连续两年击败特斯拉团队获得 Waymo SimAgents 比赛第一。



联合发起人为清华大学教授、教育部长江学者,发表过包括十余篇 Nature 子刊在内的数百篇学术论文,多次入选全球前 2% 科学家,其所带领的实验室建立并维护了具身世界模型的世界权威评测平台 WorldArena 


Manifold AI 创始团队还包括多位来自微软、Momenta、小鹏等 AI 名企的技术总监,以及前中国最年轻的券商网金部总经理, 也不乏 00后的天才少年,强大的技术背景和运营能力助力了模型架构和应用能力的快速迭代演进“ Better World Model For Better World ”是他们共同的信仰。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我觉得他们最大的优势是“会讲故事”。世界模型这个概念本身就很有想象力,再加上强大的团队背景,很容易吸引投资人的目光。当然,更重要的是他们的技术确实很牛,否则光靠讲故事是走不远的。

Manifold AI 的成功,再次证明了“技术是第一生产力”。在 AI 领域,只有掌握核心技术,才能获得资本市场的青睐。他们的快速融资也说明,国内资本开始关注真正的技术创新,而不是简单的概念炒作。这对国内 AI 创业公司来说,是一个积极的信号。

这个思路的核心在于让模型真正理解世界的空间结构,而不仅仅是生成图像。我觉得这为其他研究者提供了一个很好的方向:与其追求视觉效果的极致,不如更注重模型对物理世界的理解和建模。这可能代表着世界模型未来发展的趋势。

感觉有点像游戏里的AI突然变聪明了,不再是简单的预设程序,而是有了自己的“想法”。如果机器人和自动驾驶真的能像人一样思考,那未来的发展空间就太大了!不过,安全问题也需要重视。

Manifold AI 的方法,可以看作是结合了计算机视觉和机器人学。用三维几何来约束世界模型的生成,保证了生成结果的物理合理性。这种思路对于那些只关注图像生成的团队来说,是一种降维打击。未来的世界模型,必须要能理解物理世界。

其实我一直觉得现在很多AI都太“飘”了,只会生成一些看起来很炫酷但实际上毫无用处的东西。Manifold AI 这种注重实际应用,强调物理规律的方法,才是真正有价值的。点赞!