香港科技大学开源Craftsman3D&Dora三维生成框架,Craftsman3D融合原生3D大模型与实时几何优化,Dora提升3D-VAE重建质量与压缩率,助力三维资产高效生成与编辑。
原文标题:CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
原文作者:机器之心
冷月清谈:
怜星夜思:
2、Dora 模型中提到的“显著边缘采样(SES)算法”是如何平衡几何细节的保留和整体模型结构的?除了二面角,还有没有其他可以用来判断“显著性”的指标?
3、文章中提到Craftsman3D已被Roblox等知名企业引用,这意味着什么?对于三维内容创作的未来发展,这种开源框架的意义是什么?
原文内容
机器之心发布
机器之心编辑部
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。
相关技术已融入光影焕像的三维生成平台及产品,用户只需简单操作,就能开启专属三维创作之旅。
-
光影焕像 3D 生成平台(主站):https://triverse.ai/zh-cn/
-
光影焕像 3D 生成平台(国内备用):https://triverse.lightillusions.com/zh-cn/
本文中 Craftman3D 的共同一作李威宇、刘嘉瑞和阎鸿禹均为香港科技大学博士研究生。Dora 的第一作者为香港科技大学博士陈锐。均为香港科技大学谭平教授组的在读博士生。
三维内容的创建对于游戏、影视、AR/VR 乃至具身智能的环境仿真中具备关键作用。不过,传统三维建模方式要求建模者掌握大量专业知识,且需投入大量人工操作,这使得建模过程极为耗时,极具挑战性,对于非专业用户而言更是如此。过高的时间与人力成本,已然成为限制这些领域发展的主要瓶颈。近年来,基于 AI 的三维内容生成技术逐步改变了这一局面。借助自动化生成技术,三维内容创建的门槛大幅降低,让更广泛的用户群体能够高效地构建三维数字内容。
当前原生三维生成模型主要由两部分构成:一是 3D-VAE(3D Variational Auto Encoder)变分自编码器,它通过 Encoder 网络将三维模型压缩编码至潜在空间(latent space),并通过 Decoder 网络解码重构出三维模型;二是基于 3D-VAE 构建的潜在扩散模型(latent diffusion model)用于处理文本或图像输入的三维模型生成。三维生成大模型所呈现的细节上限,在很大程度上取决于 3D-VAE 对三维几何的编码与重建能力。为提升三维模型编解码过程中的几何细节丰富度,香港科技大学谭平团队联合字节跳动豆包大模型团队与光影焕像团队,共同提出了 Dora 模型来改进三维原生 VAE。
在 3D-VAE 模型的基础上,香港科技大学与光影焕像团队进一步提出了 Craftsman3D 算法方案,该方案借鉴了传统建模流程,能够快速生成高质量的 3D 模型,以进一步生成满足设计师对高质量三维模型的生成要求。此方法在 CVPR 中获得审稿人一致满分评价,它融合了原生 3D 大模型以及实时几何细节优化两大部分:首先由原生三维大模型生成初始模型,随后通过实时可交互几何细化操作,短短几十秒内即可生成具备高质量几何细节的三维模型。
-
Dora 开源代码:https://github.com/Seed3D/Dora/
-
Dora 项目主页:https://aruichen.github.io/Dora/
由表面均匀采样点
与显著区域采样点
联合构成:。
,研究人员将其两个顶点
和
纳入显著顶点集合
,相连边缘产生的重复顶点仅保留一份:。令表示该集合中唯一几何顶点的数量。给定显著区域目标点数,当显著顶点过多时,通过最远点采样法 (Farthest Point Sampling, FPS) 进行顶点下采样;当显著顶点不足,通过对显著边缘增加采样来补充数据,从而得到显著区域采样点
。
和显著区域采样点云
进行最远点下采样:
,整个模型
通过最小化均方误差损失进行优化:
-
Craftman3d开源代码:https://github.com/wyysf-98/CraftsMan3D/
-
Craftman3d项目主页:https://craftsman3d.github.io/





和
共享的边




的边:
表示显著边缘的数量。















