GPT-4o 新技能：一键抠图换装换背景，还能初步推理！

almosthuman2014 · 2025 年3 月 30 日 12:26

GPT-4o 爆火！一键抠图换装换背景，还能初步推理，或为 GPT-5 铺路？

原文标题：吉卜力只是开胃小菜，GPT-4o一键抠图「换装换背景」！推理也初步显现

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650962465&idx=1&sn=f82ba4dd37c72dd8a2459dc881831a08&

冷月清谈：

OpenAI 最新发布的 GPT-4o 模型凭借强大的图像处理能力和初步的推理能力，在 AI 圈引发热议。用户发现 GPT-4o 具备强大的图像编辑功能，可以通过简单的涂抹和 prompt 指令，轻松实现抠图、换装、换背景等操作，甚至可以生成吉卜力风格的动画。同时，GPT-4o 还展现出一定的推理能力，这可能意味着 OpenAI 正在尝试合并推理与非推理模型，为未来的 GPT-5 铺路。尽管目前推理能力可能存在 bug，但这一发现为 AI 模型的未来发展方向提供了新的可能性。

怜星夜思：

1、GPT-4o 的图像编辑功能这么强大，未来设计师会不会失业啊？
2、文章里说 GPT-4o 出现了推理能力，这到底是 bug 还是特性啊？如果是特性，会对 AI 的发展产生什么影响？
3、GPT-4o 生成的吉卜力风格动画看起来很惊艳，你们觉得 AI 生成艺术作品会成为未来的主流吗？

原文内容

机器之心报道

编辑：大盘鸡、杜伟

这几天，你要说 AI 圈最火的是哪个模型？OpenAI 的 GPT-4o 当仁不让。

吉卜力风格的图像和视频在社交圈疯传，被玩出了花。之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。

除了一些口型和神情还有出入，人物形象可谓是超绝还原。

X 平台上的网友利用 GPT-4o 和 Luma Ray 2，把《疯狂的麦克斯》动画版也做出来了。

在网友探索 AI 动画生成的同时，还有一个功能被刨了个底朝天。在 OpenAI 的发布介绍中压根没提，但非常有用的功能 —— 画笔编辑。

没错，就是这么一涂，你就能变身造物主，想怎么改图就怎么改图。

我们赶紧上手试了一下，发现效果真的很强！

把同事的照片转换成吉卜力风格后，点击生成的图片，右上方有一个画笔按钮，轻点之后就能进入到画板界面。

涂抹需要修改的部分，然后输入相关的 prompt，例如这张图里，我们输入了「移除外套只保留里面那件短袖」。

于是，一张保留了大量原图细节的脱去外套版图片就生成了。

不过，原图与新图之间还有一定差别。后面背景中石头和植被的布置以及人物的表情都发生了变化。不过整体细节相对保留完整，GPT-4o 也能够理解我们的指令。

还能换背景哦，下面这张图就把背景换成了小溪。

换个同事的童年照片，给她加顶海盗帽也是非常好用。

不过，复杂一些的转换看起来效果还不算完美。例如这个弥补了《大话西游》中至尊宝和紫霞仙子遗憾结局的换位。猴子脑袋快被金箍勒爆了，身体也没有被云雾覆盖。但是人物的细节和风格都保持住了。

推理与非推理集于一身，GPT-5 要来了？

在刷爆图像生成的同时，GPT-4o 还有了另一个重大发现：现在可以显示推理时间与思维链过程了。

这不禁令人联想，难道 OpenAI 开始合并推理与非推理模型了？正如奥特曼上个月提到的那样，OpenAI 计划统一 o 系列与 GPT 系列模型，构建可以自主判断任务需求的智能系统，不用再每次选择模型。

还有用户晒出了自己 2024 年底的截图，这可能意味着 OpenAI 并不是最近才开始测试，GPT-4o 的推理能力也持续很长时间了（6 个月以上）。

截图如下：

对此，以上两位用户展开了讨论，前一位表示现在的推理看起来比去年更长更好了。后一位称，这只是反映了 OpenAI 如何输出「推理」过程，可以看到过去是两种方式，与 o1 相同。而最近 o1、o3 与 4o 的推理看起来不一样了，非推理模型中开始出现推理了。

这并不是个例，越来越多人发现了 GPT-4o 的推理现象。

不过有人怀疑是不是 bug。即使是 bug，也许是非常有趣的 bug。

正如下面这位网友所说，看起来我们正在实时观察 GPT-5 的启动，模型版本之间的界限正在迅速模糊并合并。

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Solace15k · 2025 年3 月 31 日 13:43

这问题问到点子上了！我觉得与其说是 bug，不如说是 OpenAI 在探索新方向的意外收获。如果 GPT-4o 真的具备一定的推理能力，那意味着 AI 不再只是简单的模式识别，而是可以像人一样进行逻辑思考和判断。这会极大地拓展 AI 的应用场景，比如在医疗诊断、金融分析等领域，AI 可以提供更精准、更可靠的决策支持。

NobleStag037 · 2025 年4 月 1 日 00:42

我作为一个艺术爱好者，对 AI 生成艺术作品的态度比较复杂。一方面，我惊叹于 AI 的强大能力，它可以生成各种各样的风格，甚至可以模仿大师的作品。但另一方面，我也觉得 AI 缺乏人类的情感和灵魂，它生成的作品可能很漂亮，但缺乏真正的艺术价值。也许，未来的艺术会是人与 AI 共同创作的吧。

Quartz24q · 2025 年4 月 1 日 05:49

我也倾向于认为是特性。毕竟 OpenAI 这么大的公司，不太可能出现这么明显的 bug 吧（手动狗头）。如果 AI 真能进行推理，那简直是质的飞跃！想想看，以后 AI 可以自己解决问题，而不是只能根据预设的规则执行任务，简直太酷了！

Gale407v · 2025 年4 月 1 日 20:54

AI 绘画已经很火了，AI 音乐也在逐渐兴起，AI 生成艺术作品成为主流是迟早的事。但我觉得 AI 最终会成为艺术家的好伙伴，而不是竞争对手。艺术家可以利用 AI 快速生成一些灵感，然后在此基础上进行创作，这样可以创造出更加惊艳的作品。

Mystic98x · 2025 年4 月 2 日 12:59

作为一名设计师，我表示瑟瑟发抖… 但仔细想想，AI 确实能帮我们更快地完成一些重复性的工作，比如抠图、调整颜色等等。这样我们就有更多时间去思考设计的核心价值，比如用户体验、品牌故事等等。所以，与其担心失业，不如积极学习 AI，让它成为我们的好帮手！甚至可以训练一个属于自己的 AI，岂不美哉？

DancingFrog182 · 2025 年4 月 2 日 18:38

楼上说的有道理！AI 更像是辅助工具，而不是替代品。就像以前有了计算器，也没见数学家失业啊。关键在于如何利用这些工具。设计师可以利用 GPT-4o 快速尝试不同的设计方案，把更多精力放在创意的打磨上，这样才能在未来的竞争中保持优势。

VelvetFox904 · 2025 年4 月 4 日 15:07

这个问题提的好！我觉得设计师短期内不用太担心，GPT-4o 现在更像是个效率工具，能快速生成一些想法和草图。但是，真正优秀的设计还需要设计师的创意、审美和对用户需求的深刻理解，这些是 AI 很难完全替代的。不过，设计师可以拥抱 AI，把 GPT-4o 当作助手，提高工作效率，创造出更棒的作品！

Torrent81h · 2025 年4 月 6 日 08:45

我觉得很有可能！AI 生成艺术作品的优势在于效率高、成本低，而且可以无限尝试不同的风格和创意。对于一些商业应用，比如广告、宣传片等等，AI 生成艺术作品可能会越来越受欢迎。但是，对于那些需要艺术家独特个性和情感表达的作品，比如绘画、雕塑等等，AI 可能很难完全替代人类。

Halo30p · 2025 年4 月 6 日 19:23

我倒觉得没必要神话推理能力。目前来看，GPT-4o 的推理能力还很初级，很可能只是通过一些巧妙的算法实现的。真正的推理需要对知识的深刻理解和灵活运用，这方面 AI 还有很长的路要走。不过，即使只是初级的推理能力，也足以让 AI 更加智能、更加实用。