OpenAI发布GPT-5.4 mini和nano,性能接近完整版但价格大幅降低,或将成为Agent模型主力,加速AI应用落地。
原文标题:OpenAI又发力了,端上适合“养虾”新模型,便宜好用!
原文作者:AI前线
冷月清谈:
怜星夜思:
2、文章提到 Codex 的终点是“操控计算机”,你觉得这会带来哪些安全风险?我们应该如何防范?
3、你觉得未来每个人都拥有一个个人AI靠谱吗?如果真的实现了,你的个人AI会帮你做什么?
原文内容
不仅狂卷性价比,而且能力几乎不缩水。
凌晨,GPT-5.4 mini和nano版本直接上线。
其中GPT-5.4 mini,针对代码编写、推理、多模态理解,和subagent(Agent系统中被调用的“执行单元”)进行了优化,运行速度较GPT‑5 mini 有显著提升提升了两倍以上,接近完整版GPT-5.4的性能:
▪️读代码和在真实项目里的修bug能力,在SWE-bench Pro这项基准测试上,完整版GPT-5.4是57.7%,而GPT-5.4 mini已能达到54.4%。
▪️计算机操作能力(Terminal-Bench 2.0),完整版GPT-5.4得分75%,mini得分59%。
▪️博士级别高难度推理能力( GPQA Diamond),完整版GPT-5.4得分93%,mini得分85%。
▪️真实世界完成复杂任务能力(OSWorld),完整版GPT-5.4得分75%,mini得分70%。
而且价格直接“打骨折”:
GPT-5.4 mini拥有400k超大上下文,输入0.75美元/百万 token,输出4.5美元,输出价格仅为GPT-5.4的1/3。nano更狠,输入0.2美元、输出1.25美元;输出价格更是直接干到GPT-5.4的1/12。
也就是说,在高频调用、并发执行的场景下,mini在单位成本能处理更多任务。
有网友犀利地指出,既然GPT-5.4 mini如此便宜、能打、还跑得快,那么它天然适合拿去做OpenClaw的主力模型!
还有人分享了使用后感受,他表示在写东西、找引用这些任务里,GPT-5.4 mini可以和Claude Haiku掰手腕儿,价格还低一大截。更离谱的是,这个小模型整体完成任务的成功率甚至比GPT-5.4 还高,还能把信息来源标得更清楚,不太容易胡说八道。
在TBPN的最新访谈,奥特曼也描绘了Codex的未来形态:Codex 的终点,不是写代码,而是逐步演变为一个可以直接“操控计算机”的通用Agent。
在这一设想里,用户只需通过手机发起任务,剩下的交给AI完成。
理想状态下,每个人都将拥有一个基于统一后端的个人AI。它能够调用你的数据、理解你的想法与偏好,在不同设备之间自由切换,持续替你执行任务。
面对一众强有力的竞争对手,OpenAI最近确实挺急的。过去几周,他们的产品节奏几乎是“连环发车”:
▪️3月3日刚推出GPT-5.3 Instant,更顺滑,但不一定更准;
▪️3月5日上线期间模型GPT-5.4 Thinking,主打深度推理、专业任务;
▪️3月17日,再补上mini和nano,更快、更便宜。
不过话说回来,在OpenAI联创兼总裁Greg Brockman的这条新帖评论区里,依然有不少网友高呼:“还我们4o!”——一个又快又自然、很有“活人感”模型版本。




