Gemini 3 Deep Think:AI 3D建模新突破,直出STL可打印

Gemini 3 Deep Think 实现AI 3D建模突破,可从图纸直出STL文件,赋能科研与工程,将成为科研与工程领域的"第二大脑"

原文标题:还在玩AI 3D手办?Gemini 3 Deep Think已能直出STL,可打印实物

原文作者:机器之心

冷月清谈:

谷歌Gemini 3 Deep Think迎来重大升级,其亮点在于参与科研和工程决策的实力。该模型不仅能根据复杂指令生成高质量SVG图像,还能将草图或照片建模成可3D打印的实体文件,并根据用户需求进行设计,甚至可以用于科研,例如审核数学论文,优化半导体晶体生长流程。Deep Think正在从信息助手转变为科研与工程领域的"第二大脑",预示着具备深度推理能力的大模型将成为新的竞争高地。

怜星夜思:

1、Gemini 3 Deep Think 在 3D 建模方面的突破,会对设计师、工程师等专业人士的工作方式带来什么影响?是解放生产力还是会带来新的挑战?
2、文章中提到 Gemini 3 Deep Think 能够分析 WiFi 信号并进行 3D 可视化,这项技术在实际生活中有什么应用场景?除了文章中提到的,还可以应用到哪些其他的方向?
3、Gemini 3 Deep Think 被称为科研与工程领域的“第二大脑”,你认为 AI 在未来科研领域会扮演什么样的角色?它会取代人类科学家吗?

原文内容

图片
编辑|sia

推理模型赛道,已经近乎肉搏。


一边是 OpenAI  o1 系列,主打多想一步的强化推理路线,用更长思考时间换更稳的结论。


一边是 Anthropic 的 Claude Thinking,深耕研究与分析场景,强调长上下文下的审慎与可靠。


现在,谷歌也重兵压上——Gemini 3 Deep Think 迎来重大升级。


不过真正吸睛的,早就不是又赢了几个 benchmark,而是它的定位:参与科研和工程决策」的实力


业内一直流传一套很经典的民间压力测试,让模型生成一只骑自行车的鹈鹕(A pelican riding a bicycle)的 SVG 代码


题目看起来像 meme,但懂的人都知道,它同时卡三件事:空间逻辑、结构正确性、细节遵从能力。


已有网友放出相当惊艳的版本,也是我见过最好的一张。


案例来自 https://simonwillison.net/


加码难度,上硬核约束:


Generate an SVG of a California brown pelican riding a bicycle. The bicycle must have spokes and a correctly shaped bicycle frame. The pelican must have its characteristic large pouch, and there should be a clear indication of feathers. The pelican must be clearly pedaling the bicycle. The image should show the full breeding plumage of the California brown pelican.


难度瞬间从会画图,跃迁到会建模 + 会生物 + 会物理


尤其是,画出加州褐鹈鹕繁殖羽。这不是随便涂个颜色就能糊弄的。繁殖期它的头部会偏黄,颈部呈红棕色,要求模型具备非常专业的生物知识。


正在蹬踏要求 AI 能正确处理肢体与机械的交互:动物的脚丫子,必须对准踏板。


结果,Gemini 3 Deep Think 还能稳定交出质量很高的 SVG。


案例来自 https://simonwillison.net/


这里释放的信号其实很清晰:Gemini 3 Deep Think 追求的不是更会想,而是在科研级、工程级、多条件约束问题上,能更可靠地把事情做对。


纸上谈兵进化到动手造物,更明显的用例,是它能把用户的要求、草图甚至照片,直接建模成可 3D 打印的实体文件



图片

来自谷歌软件工程师@rakyll


图片

其实,谷歌也在推广中主打Deep Think会分析图纸,构建复杂的形状,并生成文件,使用3D打印机创建实体对象。


要知道 AI 以前只是个画家,你给它看一张锅的照片,它能临摹出一张一模一样的画,但那只是平面的影子。


现在, Gemini 3 Deep Think 看一眼照片,就能脑补全这张锅在各个角度的长宽高、厚度甚至把手的弧度,直接变出一个立体实物原型。


换句话说,它不止要会空间推理(理解结构、体积、厚度、连接),还要考虑一个更现实的问题:这东西能不能被制造出来、能不能被真实使用。


答案是肯定的。




它甚至开始带着审美与结构意图去做生成设计。


这是它设计的一个花盆。


来自x网友@ytiskw,请设计一个全新的时尚花盆,并使用 Python 输出为 STL 文件。条件:可以排水……


从不同角度看,的视觉会发生变化,立体感和现代感都很强,不像是单纯堆几何体,更像是在做造型语言。


还有更硬核的玩法。


这位 MIT 教授先给它一张 3D 蜘蛛网图片,要求生成交互式设计工具。


结果,它一步到位,直接产出了一整套完整的设计套件,涵盖程序化控制、仿真与优化流程,并支持 STL 文件导出。


https://x.com/ProfBuehlerMIT/status/2022635227609268480


教授甚至用这套工具设计了全新的超材料结构,以及一款受蜘蛛网启发的桥梁方案。



3D 打印后,还做了受力测试(用的是 nvidia  DGX Spark ,大约 2 斤半重),确认结构在工程上也立得住。



想象一下,你在网上刷到一个造型奇特的设计。


过去你想 3D 打印一个相近的,得会 Blender、Fusion 360 这类软件,拉曲面、调尺寸、做厚度,新手往往得学好几周。


现在,截图给 AI → 输出 STL → 丢进 3D 打印机 → 几小时后实物到手,等于把专业 3D 建模几乎压缩成了一键生成


再看看另一个用例。用 Deep Think 把周围的 WiFi 网络空间化、可视化,用 3D 方式展示信号强度和可能的物理位置关系。



平时手机里的 WiFi 列表按信号强度(RSSI)排序,但在物理空间里,强度不等于距离。比如,离你 2 米、隔着承重墙的路由器,可能比 10 米外空旷区域的路由器还要弱。


这里, Deep Think 聪明地引入了统计关联,如皮尔逊相关分析,去推断哪些 AP在物理上更可能彼此接近。


此外,还有更典型的科研叙事。比如,Deep Think 能审阅高度专业的数学论文,指出同行评审漏掉的细微逻辑缺陷,也被用于优化半导体晶体生长流程。


换句话说,谷歌想证明的不是它更会,而是它开始真的能干活


它盯住的是科研与工程里的硬骨头:没有明确边界、没有唯一答案、数据又脏又乱的真实研究问题。


而且,不只是卷数学、编程,而是把触角伸向化学、物理(包括理论物理)等多个科学领域,全面铺开。


随着通用对话能力快速商品化,那些真正能处理复杂财务模型、实验数据与工程设计的深度推理能力,正在成为新的竞争高地。


谷歌正在试图把大模型从信息助手,推向科研与工程体系里的第二大脑。如果后续真实采用率跟得上,这一步的分量,可能会比单纯的性能提升更大。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

从商业角度来看,定制化服务是未来的趋势。Gemini 3 Deep Think 可以帮助商家快速生成定制化产品的模型,降低设计成本,提高生产效率。比如,你可以用 AI 设计一款独一无二的 T 恤,商家直接 3D 打印出来,这绝对比批量生产更有吸引力。

我觉得在消费级应用方面潜力巨大!想象一下,你可以用手机拍一张旧家具的照片,AI 就能帮你生成一个 3D 模型,然后直接在网上找到匹配的新家具,是不是很方便?或者,你可以用 AI 设计个性化的手机壳、玩具等等,这绝对能吸引一大批年轻用户。

这是个非常重要的问题。技术发展不能脱离伦理的约束。我觉得首先要加强数据安全管理,建立严格的数据访问权限控制机制,防止数据泄露和滥用。其次,要重视算法偏见问题,通过引入多样化的数据集、优化算法设计等方式,尽量减少偏见对研究结果的影响。此外,还需要建立完善的伦理审查机制,对科研项目进行伦理评估,确保研究符合伦理规范。

谢邀,人在打印机旁,刚打完一个AI设计的花盆。

讲真,这玩意儿出来,短期内肯定会冲击3D建模行业,尤其是那些接外包、做简单模型的小工作室。但反过来想,这也是一次升级的机会。以后建模师可能要变成“AI调参师”了,核心竞争力变成prompt写得好不好,能不能引导AI生成想要的模型。而且,高端设计、艺术设计这些对创意要求高的领域,AI很难完全取代人类。

所以,我的建议是,赶紧学学怎么跟AI交流,把这玩意儿变成你的工具,而不是你的掘墓人。

别想的那么复杂,我觉得最直接的应用就是“蹭网神器”升级版!以后走到哪儿,AI直接告诉你哪个WiFi信号最好,还能避开承重墙,简直是居家旅行必备!当然,正经点说,这个技术在智慧城市建设方面肯定大有可为,比如可以用来监控城市WiFi覆盖率,及时发现网络故障,提升城市居民的网络体验。

从技术角度分析,将WiFi信号空间可视化具有多种潜在应用场景。例如,在智能家居领域,可以利用该技术实现更精准的室内定位,从而优化智能设备的控制策略。在网络安全领域,可以检测异常的信号模式,及时发现潜在的网络攻击。在城市规划领域,可以分析不同区域的WiFi覆盖情况,为优化网络基础设施提供数据支持。此外,在商业领域,商家可以利用该技术了解顾客在店铺内的移动轨迹,从而优化商品陈列和营销策略。总而言之,WiFi信号空间可视化技术具有广泛的应用前景,有望在多个领域发挥重要作用。

谢邀,人在打印机旁,刚打完一个AI设计的手机壳。我觉得影响是肯定的,但不会是颠覆性的。现在AI建模的精度和可控性还有提升空间,复杂的设计还是需要人工干预。而且,审美这东西,AI目前还差得远呢。不过,对于快速验证想法,或者做一些简单的模型,AI绝对是神器!

我倒是觉得,AI 可能会倒逼学术评价体系改革。现在很多学术评价标准,都过于注重论文数量和引用率,忽略了研究的实际价值和创新性。AI 的出现,可能会让我们重新思考,什么样的研究才是真正有价值的。也许以后,我们会更看重研究的原创性、实用性和社会影响力。

优化嘛,说白了就是让晶体长得更快、更好、更便宜!你想啊,晶体生长是个漫长的过程,而且容易出错,产生各种缺陷。AI厉害就厉害在它能记住海量的数据,然后通过复杂的算法,找到影响晶体生长的关键因素,从而实现精准控制。具体怎么实现的?这得问谷歌的工程师了,反正我是个吃瓜群众,只知道AI改变生活!

这让我想起了工业革命时期,机器刚出现的时候,很多人担心纺织工人会失业。但实际上,机器解放了工人的双手,让他们可以从事更复杂的工作,生产效率也大大提高。Deep Think 这种 AI 建模工具,我觉得也是类似的道理。它可能会改变一些工作内容,但是也会创造出新的可能性,比如个性化定制、快速原型设计等等。重要的是要适应这种变化,学习如何与 AI 协同工作。

“第二大脑”这个说法很形象!我觉得AI在科研领域会扮演一个很重要的辅助角色。它可以帮助我们处理大量数据、发现隐藏的模式、加速实验流程。但要说取代人类科学家,我觉得还早。科研不仅仅是数据分析,还需要灵感、直觉、批判性思维,以及与同行交流合作。这些都是AI目前难以企及的。

这个问题很有意思!我觉得短期来看,Definitely是解放生产力。以前需要花费大量时间学习建模软件、调整参数,现在AI可以快速生成原型,让专业人士可以更快地验证想法。但同时,也带来了新的挑战,比如如何更好地与AI协同工作,如何利用AI的生成能力进行创新,都是需要思考的问题。长期来看,如果AI能力足够强,会不会替代一部分设计师/工程师的简单工作?这也会是个需要长期关注的点。

与其说AI会取代科学家,不如说它会创造一种新的科研模式。未来的科研,可能是人机协作的模式。科学家提出问题,AI 提供数据和模型,科学家进行验证和解释。这种模式下,科研效率会大大提高,我们也能更快地解决一些复杂的科学问题。想想就让人激动!

我想到一个有点科幻的应用场景:ghost hunting!咳咳,开个玩笑。但认真说,如果这项技术足够精确,或许可以用于探测一些特殊的电磁场或信号异常,用于科学研究或者寻找隐藏的设备(监听设备?)。当然,这需要更高的精度和更复杂的算法了。

从科学哲学的角度来看,科学的本质是探索未知。AI 可以帮助我们更快地到达已知的边界,但突破边界,需要的是创新思维和想象力。AI 擅长的是归纳和优化,而人类科学家擅长的是演绎和创造。所以,我认为 AI 和人类科学家应该是互补的关系,而不是替代关系。

这个问题很棒!除了文章里说的,我觉得这项技术在智能家居和物联网领域很有前景。比如,可以帮助我们优化智能家居设备的摆放位置,让它们能够更好地互相连接和协同工作。想象一下,AI 可以根据你的房间结构和设备位置,自动调整 WiFi 信号的发射角度,让每个角落都能有稳定的网络连接,是不是很酷?

从更专业的角度来看,这种技术在无线网络规划和优化方面有很大的潜力。例如,在大型场馆、商场等复杂环境中,可以通过分析 WiFi 信号分布,来优化基站的部署位置,提高网络覆盖率和用户体验。甚至可以用于应急救援,快速定位受困人员的无线设备信号,提高救援效率。

从历史角度来看,每一次技术革新都会对某些行业产生冲击,同时也带来新的机遇。AI 3D建模的进步可能会导致一些基础建模工作岗位减少,但对于那些能够熟练运用AI工具,进行更复杂、更具创造性的设计工作的人来说,反而会提升他们的价值。关键在于如何拥抱新技术,将其融入到自己的工作流程中。