GPT-4o生图太火爆,OpenAI被迫限流:GPU快撑不住了

GPT-4o生图功能因需求过大导致OpenAI限流,其强大的图像能力引发关于AI发展方向和版权问题的讨论。

原文标题:GPT-4o的P图太火了,GPU在融化,官方终于限流了

原文作者:机器之心

冷月清谈:

OpenAI的GPT-4o图像生成功能因用户需求过大导致GPU压力过大,官方已宣布暂时限流。GPT-4o强大的图像理解和生成能力,源于其原生多模态大模型,这使得它在图像生成方面超越了以往简单调用生图模型的方式,能够结合自身知识和思维链流程,实现更精准的反馈和风格一致性。然而,这种强大的能力也带来了更高的计算需求,导致效率问题。此外,诸如版权限制和生成风格等问题也浮出水面,例如辛普森一家风格的图片受到版权限制,而吉卜力风格的图片却被广泛使用,引发了关于版权双标的讨论。目前,GPT-4o的功能已面向所有付费用户开放,并计划在未来几周内向免费用户开放。

怜星夜思:

1、GPT-4o的图像生成能力已经如此强大,那么未来AI在创意产业中会扮演什么样的角色?设计师会完全被取代吗,还是会演变成一种新的协作模式?
2、文章中提到了吉卜力风格图像的版权问题,为什么这种风格的图像在互联网上如此流行,却似乎没有受到版权限制?这是否反映了当前AI生成内容版权监管的滞后性?
3、OpenAI的GPT-4o首先对付费用户开放,之后再考虑免费用户,你觉得这种策略合理吗?如果让你来设计,你会如何平衡付费用户和免费用户的权益?

原文内容

机器之心报道
编辑:泽南

「看到人们喜欢 ChatGPT 中的图片功能真是太有趣了,但是我们的 GPU 正在融化。」


上线不到 72 小时,OpenAI 的 GPT-4o 原生图像功能终于扛不住了。



今天凌晨,OpenAI CEO 山姆・奥特曼在社交平台 X 上宣布 ChatGPT 图像生成功能开始暂时受限。这一次,他没有具体说明次数限制是多少,但表示希望这项保障措施不需要实施很长时间,因为 OpenAI 正在尝试优化效率。


随着用户在互联网上发布大量 ChatGPT 生成的图像,传播开来之后再吸引到更多的用户,OpenAI 升级后的图像工具火爆程度远远超出了预期。其实 GPT-4o 生成图像的速度越来越慢,很多用户已经在抱怨了,周四时生成一张图片的速度就长达半个小时。


要知道,现在 GPT-4o 生图还是仅限于付费版用户的功能(Plus、Pro 和 Team 用户)。虽然奥特曼仍然许诺免费的 ChatGPT 账户未来每天可以获得三次生成机会,但是照目前的情况来看距离兑现反而还越来越远了。


看起来这一回,AI 的图片生成能力终于超过了某个阈值,切实地在重塑着世界。


人们从 GPT-4o 生成的图像中会发现一些令人毛骨悚然的细节,可以看出 AI 是能够理解你生成图片背后想要表达的含义。这说明 GPT-4o 的绘图能力源自 LLM 本身,并不是像以前那样简单地调用专门的生图模型(Dall-E)。经过了最新的思维链流程,AI 充分结合了自身的知识,能够实现更好的反馈。


用 GPT-4o 生成的图片。


原生多模态的大模型是如此的强大,对此很多业内人士已经开始认为,当下一些明星 AI 创业公司开发的图像生成工具、RAG 工具、AI IDE、工作流、智能体等会在基础大模型能力提升之后变得不值一提。


毕竟如果把 GPT-4o 比作一个知识渊博,又有理性的设计师,那么 Stable Diffusion 还仅局限于美工的程度。


OpenAI 曾报告说,GPT-4o 生图能力的大幅提升源自于一系列技术改进,在执行生成任务的过程中,AI 会对人类提出的 Prompt 进行细化,编写出一个更加详细的英文版提示词。它还会充分调用模型内已有的知识库和对话上下文,并对人们上传的参考图片预先进行转化处理。


由此生成的图片可以轻松获得人们构想的效果,具备完美的风格一致性,一举让此前还属于玩具的图像生成工具成为了兼具准确性与实用性的强大工具。


当然,这一切都是建立在更加复杂的推理和计算基础上的。目前的 GPT-4o 在效率、逻辑上也存在一些问题。比如奥特曼的推文下有人就在质疑:我试图生成辛普森一家风格的图片,ChatGPT 算完了才回复我「受到版权限制无法生成」,为什么不在生成图片之前就限制呢?



说到生成图像的风格,其实又引出了另一个问题:整个互联网上大家一直在生成的吉卜力风格的却不受版权限制,这是否也是一种双标?


自从奥特曼换了头像带起节奏,很多人在用 GPT-4o 生成吉卜力工作室画风的图像,有的人做出了表情包开始卖,也有人顺着这股风潮开始推出滤镜 App,结果有网友开始恶搞,假称吉卜力终于忍无可忍了,发来了律师函:



或许在 OpenAI 改进好大模型之前,这股 GPT-4o 改图的风潮就会因为其他层面的问题而受到影响。


不过 OpenAI 并没有停止前进。今天凌晨,他们又宣布了 ChatGPT 的另一波更新:



更新后的 GPT-4o 功能已面向所有付费用户开放。OpenAI 表示,免费用户将在未来几周内获得相同功能。


AI 引发的革命,还在继续。


参考内容:

https://x.com/sama/status/1905296867145154688



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

从技术角度来说,AI生成内容的版权归属问题非常复杂。AI是工具,prompt是指令,那版权到底归属于谁?是模型的开发者?是prompt的输入者?还是AI本身?现在的法律体系还没有明确的界定。希望未来能有更清晰的法律框架,保护原创者的权益,同时也鼓励AI技术的健康发展。

作为一个设计师,我其实有点焦虑。GPT-4o这种模型如果持续发展下去,基础的设计工作肯定会被AI替代。但另一方面,这也迫使设计师去提升自己的核心竞争力,比如更深入的用户洞察、更抽象的创意概念。所以,既是挑战,也是机遇吧!

我觉得这个策略挺合理的,毕竟研发和维护这些模型需要巨大的成本,优先服务付费用户是商业逻辑。而且,通过付费用户的反馈,可以不断改进模型,最终让免费用户也能享受到更好的服务。这就像游戏里的“抢先体验”版,付费玩家先玩,提供反馈,官方优化后再推出免费版。

这个问题问得好!我觉得这主要是因为吉卜力风格本身是一种广泛流传的艺术风格,而不是对吉卜力工作室具体作品的直接复制。就像模仿印象派画风一样,只要不直接抄袭作品,一般不会构成侵权。但AI生成内容的版权监管确实是个新课题,法律法规还没跟上技术发展的速度。

一个可能的解释是,吉卜力工作室可能采取了相对宽松的版权策略,鼓励粉丝进行二创,以扩大其影响力。当然,这并不意味着可以随意商用。对于AI生成的吉卜力风格图像,如果用于商业用途,最好还是谨慎一些,咨询专业的法律人士。

我是白嫖党,但我也能理解OpenAI的做法。如果让我来设计,我会给免费用户提供有限的访问权限,比如每天限制生成图片的数量,或者限制某些高级功能。付费用户则可以享受更高的生成速度、更多的生成次数,以及更优先的技术支持。这样既能鼓励用户付费,又能保证免费用户也能体验到基本功能。

从社会公平的角度来看,完全免费的模型可能更容易造成数字鸿沟。如果只有一部分人能负担得起使用AI的成本,那么他们在各个领域都会拥有更大的优势。所以,提供一定程度的免费服务是必要的,但这需要依靠合理的商业模式来支撑,比如广告收入、企业合作等等。关键在于找到一个平衡点,既能保证AI的可持续发展,又能让更多人受益。

这个问题很有意思!我觉得完全取代设计师不太可能,毕竟创意这东西,AI再强也得有人引导。更可能的情况是,AI变成设计师的超级助手,重复性的工作交给AI,设计师可以专注于更具挑战性和创新性的部分。就像钢铁侠和贾维斯那样,AI提供技术支持,最终决策还是人类来做。

从经济学的角度看,AI介入创意产业必然会带来效率的大幅提升,降低边际成本。这意味着未来的创意产品可能会更加廉价易得,但原创性和个性化可能会成为稀缺资源。对于设计师来说,如何找到自己在新市场环境下的定位,提供差异化的价值,是需要认真思考的问题。