OpenAI发布GPT-5.4 mini和nano版本:更便宜、更快、更实用!

OpenAI发布GPT-5.4 mini和nano,性能接近完整版但价格大幅降低,或将成为Agent模型主力,加速AI应用落地。

原文标题:OpenAI又发力了,端上适合“养虾”新模型,便宜好用!

原文作者:AI前线

冷月清谈:

OpenAI近日发布了GPT-5.4 mini和nano两个新模型,在代码编写、推理和多模态理解等方面进行了优化。GPT-5.4 mini在多项基准测试中接近完整版GPT-5.4的性能,但价格大幅降低,输出价格仅为GPT-5.4的1/3,nano版本则更低。这些小模型在高频调用、并发执行的场景下具有更高性价比,适合作为OpenClaw的主力模型。有用户反馈,GPT-5.4 mini在写作和查找引用等任务中表现出色,甚至在某些方面优于GPT-5.4。OpenAI正积极推动Codex演变为可直接操控计算机的通用Agent,旨在让用户拥有能够调用数据、理解偏好并持续执行任务的个人AI。近期,OpenAI密集发布多个新模型,以应对激烈的市场竞争。

怜星夜思:

1、GPT-5.4 mini 和 nano 的低价策略,会对其他大模型厂商造成哪些影响?他们会如何应对?
2、文章提到 Codex 的终点是“操控计算机”,你觉得这会带来哪些安全风险?我们应该如何防范?
3、你觉得未来每个人都拥有一个个人AI靠谱吗?如果真的实现了,你的个人AI会帮你做什么?

原文内容

左右滑动查看更多图片

不仅狂卷性价比,而且能力几乎不缩水。

凌晨,GPT-5.4 mini和nano版本直接上线。

其中GPT-5.4 mini,针对代码编写、推理、多模态理解,和subagent(Agent系统中被调用的“执行单元”)进行了优化,运行速度较GPT‑5 mini 有显著提升提升了两倍以上,接近完整版GPT-5.4的性能:

▪️读代码和在真实项目里的修bug能力,在SWE-bench Pro这项基准测试上,完整版GPT-5.4是57.7%,而GPT-5.4 mini已能达到54.4%。
▪️计算机操作能力(Terminal-Bench 2.0),完整版GPT-5.4得分75%,mini得分59%。
▪️博士级别高难度推理能力( GPQA Diamond),完整版GPT-5.4得分93%,mini得分85%。
▪️真实世界完成复杂任务能力(OSWorld),完整版GPT-5.4得分75%,mini得分70%。

而且价格直接“打骨折”:

GPT-5.4 mini拥有400k超大上下文,输入0.75美元/百万 token,输出4.5美元,输出价格仅为GPT-5.4的1/3。nano更狠,输入0.2美元、输出1.25美元;输出价格更是直接干到GPT-5.4的1/12。

也就是说,在高频调用、并发执行的场景下,mini在单位成本能处理更多任务。

有网友犀利地指出,既然GPT-5.4 mini如此便宜、能打、还跑得快,那么它天然适合拿去做OpenClaw的主力模型!

还有人分享了使用后感受,他表示在写东西、找引用这些任务里,GPT-5.4 mini可以和Claude Haiku掰手腕儿,价格还低一大截。更离谱的是,这个小模型整体完成任务的成功率甚至比GPT-5.4 还高,还能把信息来源标得更清楚,不太容易胡说八道。

在TBPN的最新访谈,奥特曼也描绘了Codex的未来形态:Codex 的终点,不是写代码,而是逐步演变为一个可以直接“操控计算机”的通用Agent。

在这一设想里,用户只需通过手机发起任务,剩下的交给AI完成。

理想状态下,每个人都将拥有一个基于统一后端的个人AI。它能够调用你的数据、理解你的想法与偏好,在不同设备之间自由切换,持续替你执行任务。

面对一众强有力的竞争对手,OpenAI最近确实挺急的。过去几周,他们的产品节奏几乎是“连环发车”:

▪️3月3日刚推出GPT-5.3 Instant,更顺滑,但不一定更准;
▪️3月5日上线期间模型GPT-5.4 Thinking,主打深度推理、专业任务;
▪️3月17日,再补上mini和nano,更快、更便宜。

不过话说回来,在OpenAI联创兼总裁Greg Brockman的这条新帖评论区里,依然有不少网友高呼:“还我们4o!”——一个又快又自然、很有“活人感”模型版本。

这问题问得好!OpenAI 这波降价操作,感觉就像手机厂商打价格战,直接卷起来了。其他厂商估计也得跟着降价,要么就得在模型能力上做出差异化,比如专注特定领域,或者开发更易用的工具链。不然就只能眼看着市场份额被蚕食了。

我觉得可以从两方面入手。一方面,加强 AI 自身的安全防护,防止被恶意利用;另一方面,建立完善的监管机制,对 AI 的行为进行监控和限制。当然,这需要政府、企业和研究机构共同努力。

我觉得这个想法挺有意思的。我的个人AI估计会变成我的私人助理,帮我管理财务、规划旅行、甚至帮我找对象!不过,前提是它得足够聪明,不会给我瞎出主意。

从技术角度来看,实现每个人都拥有一个个人AI还面临很多挑战。首先,需要解决数据隐私问题,确保个人数据不被泄露;其次,需要提高 AI 的智能水平,让它真正理解用户的需求;最后,需要降低 AI 的使用成本,让每个人都能负担得起。如果这些问题都能解决,那么个人AI的普及将是大势所趋。

个人认为,这会加速整个行业的洗牌。小型厂商如果不能快速找到自己的定位,可能会面临生存危机。大型厂商可能会加大研发投入,寻找新的技术突破口,或者通过合作来降低成本。最终受益的还是我们用户,能用上更便宜更好用的AI服务。

细思极恐啊!如果 AI 可以直接操控计算机,那病毒、黑客什么的,可能就直接被 AI 取代了。想想看,AI 控制下的勒索病毒,防都防不住!感觉以后网络安全得升级成 AI 安全了。

感觉有点像科幻电影里的情节了!如果真有个人AI,我希望它能帮我处理各种琐事,比如自动回复邮件、整理文件、安排日程等等。这样我就能有更多时间去做自己喜欢的事情了!

从学术角度分析,OpenAI 的低价策略可能会引发一场“算力通货膨胀”。其他厂商为了保持竞争力,不得不投入更多资源购买算力,这可能会导致整个行业的成本上升。但长期来看,随着芯片技术的进步和算法的优化,算力成本会逐渐降低,最终形成新的平衡。

从信息安全的角度来看,这确实是一个值得警惕的问题。我们需要建立一套完善的访问控制机制,确保 AI 只能访问和操作经过授权的资源。同时,应该对 AI 的行为进行审计,及时发现和处理异常情况。此外,还需要加强对 AI 算法的安全性评估,防止出现漏洞。