GPT-4o 新技能:一键抠图换装换背景,还能初步推理!

GPT-4o 爆火!一键抠图换装换背景,还能初步推理,或为 GPT-5 铺路?

原文标题:吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现

原文作者:机器之心

冷月清谈:

OpenAI 最新发布的 GPT-4o 模型凭借强大的图像处理能力和初步的推理能力,在 AI 圈引发热议。用户发现 GPT-4o 具备强大的图像编辑功能,可以通过简单的涂抹和 prompt 指令,轻松实现抠图、换装、换背景等操作,甚至可以生成吉卜力风格的动画。同时,GPT-4o 还展现出一定的推理能力,这可能意味着 OpenAI 正在尝试合并推理与非推理模型,为未来的 GPT-5 铺路。尽管目前推理能力可能存在 bug,但这一发现为 AI 模型的未来发展方向提供了新的可能性。

怜星夜思:

1、GPT-4o 的图像编辑功能这么强大,未来设计师会不会失业啊?
2、文章里说 GPT-4o 出现了推理能力,这到底是 bug 还是特性啊?如果是特性,会对 AI 的发展产生什么影响?
3、GPT-4o 生成的吉卜力风格动画看起来很惊艳,你们觉得 AI 生成艺术作品会成为未来的主流吗?

原文内容

机器之心报道

编辑:大盘鸡、杜伟


这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。


吉卜力风格的图像和视频在社交圈疯传,被玩出了花。之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。



除了一些口型和神情还有出入,人物形象可谓是超绝还原。


X 平台上的网友利用 GPT-4o 和 Luma Ray 2,把《疯狂的麦克斯》动画版也做出来了。



在网友探索 AI 动画生成的同时,还有一个功能被刨了个底朝天。在 OpenAI 的发布介绍中压根没提,但非常有用的功能 —— 画笔编辑。



没错,就是这么一涂,你就能变身造物主,想怎么改图就怎么改图。


我们赶紧上手试了一下,发现效果真的很强!


把同事的照片转换成吉卜力风格后,点击生成的图片,右上方有一个画笔按钮,轻点之后就能进入到画板界面。



涂抹需要修改的部分,然后输入相关的 prompt,例如这张图里,我们输入了「移除外套只保留里面那件短袖」。



于是,一张保留了大量原图细节的脱去外套版图片就生成了。



不过,原图与新图之间还有一定差别。后面背景中石头和植被的布置以及人物的表情都发生了变化。不过整体细节相对保留完整,GPT-4o 也能够理解我们的指令。


还能换背景哦,下面这张图就把背景换成了小溪。



换个同事的童年照片,给她加顶海盗帽也是非常好用。



不过,复杂一些的转换看起来效果还不算完美。例如这个弥补了《大话西游》中至尊宝和紫霞仙子遗憾结局的换位。猴子脑袋快被金箍勒爆了,身体也没有被云雾覆盖。但是人物的细节和风格都保持住了。



推理与非推理集于一身,GPT-5 要来了?


在刷爆图像生成的同时,GPT-4o 还有了另一个重大发现:现在可以显示推理时间与思维链过程了。


这不禁令人联想,难道 OpenAI 开始合并推理与非推理模型了?正如奥特曼上个月提到的那样,OpenAI 计划统一 o 系列与 GPT 系列模型,构建可以自主判断任务需求的智能系统,不用再每次选择模型。



还有用户晒出了自己 2024 年底的截图,这可能意味着 OpenAI 并不是最近才开始测试,GPT-4o 的推理能力也持续很长时间了(6 个月以上)。



截图如下:




对此,以上两位用户展开了讨论,前一位表示现在的推理看起来比去年更长更好了。后一位称,这只是反映了 OpenAI 如何输出「推理」过程,可以看到过去是两种方式,与 o1 相同。而最近 o1、o3 与 4o 的推理看起来不一样了,非推理模型中开始出现推理了。



这并不是个例,越来越多人发现了 GPT-4o 的推理现象。



不过有人怀疑是不是 bug。即使是 bug,也许是非常有趣的 bug。



正如下面这位网友所说,看起来我们正在实时观察 GPT-5 的启动,模型版本之间的界限正在迅速模糊并合并。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

这问题问到点子上了!我觉得与其说是 bug,不如说是 OpenAI 在探索新方向的意外收获。如果 GPT-4o 真的具备一定的推理能力,那意味着 AI 不再只是简单的模式识别,而是可以像人一样进行逻辑思考和判断。这会极大地拓展 AI 的应用场景,比如在医疗诊断、金融分析等领域,AI 可以提供更精准、更可靠的决策支持。

我作为一个艺术爱好者,对 AI 生成艺术作品的态度比较复杂。一方面,我惊叹于 AI 的强大能力,它可以生成各种各样的风格,甚至可以模仿大师的作品。但另一方面,我也觉得 AI 缺乏人类的情感和灵魂,它生成的作品可能很漂亮,但缺乏真正的艺术价值。也许,未来的艺术会是人与 AI 共同创作的吧。

我也倾向于认为是特性。毕竟 OpenAI 这么大的公司,不太可能出现这么明显的 bug 吧(手动狗头)。如果 AI 真能进行推理,那简直是质的飞跃!想想看,以后 AI 可以自己解决问题,而不是只能根据预设的规则执行任务,简直太酷了!

AI 绘画已经很火了,AI 音乐也在逐渐兴起,AI 生成艺术作品成为主流是迟早的事。但我觉得 AI 最终会成为艺术家的好伙伴,而不是竞争对手。艺术家可以利用 AI 快速生成一些灵感,然后在此基础上进行创作,这样可以创造出更加惊艳的作品。

作为一名设计师,我表示瑟瑟发抖… 但仔细想想,AI 确实能帮我们更快地完成一些重复性的工作,比如抠图、调整颜色等等。这样我们就有更多时间去思考设计的核心价值,比如用户体验、品牌故事等等。所以,与其担心失业,不如积极学习 AI,让它成为我们的好帮手! 甚至可以训练一个属于自己的 AI,岂不美哉?

楼上说的有道理!AI 更像是辅助工具,而不是替代品。就像以前有了计算器,也没见数学家失业啊。关键在于如何利用这些工具。设计师可以利用 GPT-4o 快速尝试不同的设计方案,把更多精力放在创意的打磨上,这样才能在未来的竞争中保持优势。

这个问题提的好!我觉得设计师短期内不用太担心,GPT-4o 现在更像是个效率工具,能快速生成一些想法和草图。但是,真正优秀的设计还需要设计师的创意、审美和对用户需求的深刻理解,这些是 AI 很难完全替代的。不过,设计师可以拥抱 AI,把 GPT-4o 当作助手,提高工作效率,创造出更棒的作品!

我觉得很有可能!AI 生成艺术作品的优势在于效率高、成本低,而且可以无限尝试不同的风格和创意。对于一些商业应用,比如广告、宣传片等等,AI 生成艺术作品可能会越来越受欢迎。但是,对于那些需要艺术家独特个性和情感表达的作品,比如绘画、雕塑等等,AI 可能很难完全替代人类。

我倒觉得没必要神话推理能力。目前来看,GPT-4o 的推理能力还很初级,很可能只是通过一些巧妙的算法实现的。真正的推理需要对知识的深刻理解和灵活运用,这方面 AI 还有很长的路要走。不过,即使只是初级的推理能力,也足以让 AI 更加智能、更加实用。