OpenAI推出云端软件工程智能体Codex,赋能ChatGPT编程能力

OpenAI推出Codex云端软件工程智能体,集成至ChatGPT,可编写代码、修复bug、提交PR,大幅提升编程效率,编程或将变得更简单。

原文标题:刚刚,OpenAI最强编程智能体上线ChatGPT

原文作者:机器之心

冷月清谈:

OpenAI发布了Codex,一个云端软件工程智能体,它能够帮助开发者编写功能、解答代码库相关问题、修复bug以及提交pull request。Codex基于codex-1模型,该模型是OpenAI o3的一个专门针对软件工程优化的版本,使用强化学习针对真实的编程任务进行训练,生成的代码能够高度反映人类的风格和PR偏好,精确遵循指令,并可以迭代运行测试。目前,ChatGPT Pro、Team 和 Enterprise 用户可以使用 Codex,Plus 和 Edu 用户也即将上线使用。用户可以通过ChatGPT侧边栏访问Codex,输入 prompt 并点击 "编写代码" 按钮即可执行新的编程任务,Codex具备读写文件的能力,并可运行测试框架、代码检查器和类型检查器等。OpenAI强调了Codex的安全性,所有任务都在云端的安全隔离容器中运行,并提供了可验证的证据链方便用户追溯任务执行全过程。未来,OpenAI计划推出更具交互性和灵活性的智能体工作流。

怜星夜思:

1、Codex的出现,会对软件开发行业带来哪些深远影响?例如,初级程序员的就业前景会受到影响吗?
2、Codex目前仅支持部分ChatGPT用户使用,未来全面开放后,你认为它最有可能在哪些编程领域发挥重要作用?
3、OpenAI强调了Codex的安全性,但作为一个能够读写代码库的智能体,你认为它在安全方面还存在哪些潜在风险?

原文内容

机器之心报道

机器之心编辑部

从编程开始,今年智能体要卷飞了!!!


昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。



就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入了 Codex 的研究预览版。


Codex 是一个云端软件工程智能体,可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等。并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。



Codex 背后的模型是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。


自今天开始,ChatGPT Pro、Team 和 Enterprise 用户即可使用 Codex,Plus 和 Edu 用户也很快可以上线使用。



对于 OpenAI 的新智能体产品,大家的反应似乎非常兴奋。有人表示自己被震撼到了,迫不及待想要体验一番。十年前学习编程时,绝对想不到这会成为可能。



也有人认为,Codex 这个云原生的智能体实际上可以自行构建、修复并交付功能,感觉就像软件开始了大规模自我编写。



还有人现身说法,在经过对 Codex 大量测试后发现,当它正常运作时,几乎更擅长「模拟」代码正在做什么以及看起来是什么样子。



接下来,我们先看一下官方示例,Codex 可以并行处理多项任务:



比如要求 Codex「找出尽可能多的 topos 和语法错误并进行修复」,它会检查代码库的可维护性和 bugs:


图片


修复文件名中含有特殊字符的 /diff 错误:


图片


创建并使用 DEFAULT_ALCATRAZ_TIMEOUT 常量:


图片


Codex 工作原理


从今天开始,用户可以通过 ChatGPT 侧边栏访问 Codex,输入 prompt 并点击 "编写代码" 按钮即可执行新的编程任务。


若需针对代码库提问,可点击 "Ask"。每项任务均在独立隔离的环境中处理,该环境已预加载用户的代码库。Codex 具备读写文件的能力,并可运行包括测试框架、代码检查器和类型检查器在内的各类命令。任务完成时间通常为 1 至 30 分钟(视复杂度而定),用户可实时查看 Codex 的处理进度。


任务完成后,Codex 会将其修改提交至专属环境。通过终端日志引用和测试输出记录,Codex 为所有操作提供可验证的证据链,便于用户追溯任务执行全过程。用户还可审阅结果、要求进一步修改、创建 GitHub 拉取请求或直接将变更集成至本地环境。在产品中,用户可将 Codex 环境配置为无限接近实际开发环境。


图片


Codex 可遵循代码库中的 AGENTS.md 文件执行操作。这类文本文件(类似 README.md)用于指导 Codex 如何浏览代码库、运行哪些测试命令,以及如何遵循项目标准规范。与人类开发者类似,当获得配置好的开发环境、可靠的测试方案和清晰的文档时,Codex 智能体能发挥最佳效能。


在编码评估和内部基准测试中,即便没有 AGENTS.md 文件或定制脚手架,codex-1 也展现出强劲性能。



构建安全可靠的智能体


在设计 Codex 时,OpenAI 优先考虑安全性和透明度,以便用户能够验证其输出。用户可以通过引用、终端日志和测试结果来检查 Codex 的工作。




与 o3 相比,codex-1 始终能够生成更清晰的 patch,以便立即进行人工审核并集成到标准工作流程中。



Codex 与 o3 对比:


图片


图片


OpenAI 表示,Codex 智能体完全运行于云端的安全隔离容器中。任务执行期间将禁用互联网访问,确保智能体仅能交互以下内容:通过 GitHub 仓库明确提供的代码、用户通过设置脚本配置的预安装依赖项以及该智能体无法访问任何外部网站、API 或其他服务。


Codex 定价如何?


Codex 用起来贵不贵?


OpenAI 表,从今天开始,将向全球范围内的 ChatGPT Pro、Enterprise 和 Team 用户开放 Codex。在接下来的几周内,用户可以免费畅享 Codex,探索它的各项功能。此后,他们将推出限速访问和灵活的按需付费选项,供用户购买额外使用量。


对于使用 codex-mini-latest 进行开发的用户,该模型可通过 Responses API 调用,定价为:


  • 输入 tokens:每 100 万 $1.50

  • 输出 tokens:每 100 万 $6


此外,OpenAI 表示,Codex 仍处于早期开发阶段。作为研究预览版,它目前尚不具备某些功能,例如:前端工作所需的图像输入支持,在 Codex 运行过程中实时调整智能体的能力。


此外,远程智能体的执行速度比交互式编辑慢,这可能需要一定的适应时间。不过,随着时间推移,与 Codex 智能体的协作将越来越像与同事的异步协作。


最后 OpenAI 表示,未来计划推出更具交互性和灵活性的智能体工作流。


未来,编程也许真会变的越来越简单。


参考链接:https://openai.com/index/introducing-codex/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

从阴谋论的角度来看,如果Codex被别有用心的人利用,可能会批量生成带有后门的软件。这些软件一旦被广泛使用,后果不堪设想。所以,需要加强对AI生成代码的监管和审查,防止其被滥用。

我个人觉得对于一些低代码/无代码平台来说是福音。Codex可以极大地提升这些平台的智能化水平,让不懂编程的人也能通过简单的配置和指令,快速构建应用。这会进一步降低软件开发的门槛,让更多人参与到创新中来。想象一下,以后人人都是开发者!

关于软件开发行业的深远影响,我觉得短期内可能不会有颠覆性的改变,但长期来看,行业的分工一定会发生变化。初级程序员可能需要更快地适应新的工具和流程,需要提升解决复杂问题的能力,而不仅仅是编写基础代码。如果只是做简单重复的工作,被替代的可能性会增加。当然,新的工具也会创造出新的岗位,比如prompt工程师或者AI辅助开发工程师?

别慌,我十年老码农来分析一波。这种AI工具肯定会影响行业格局,但完全替代人工还早得很。它能做的主要是代码生成、bug修复这些体力活,真正的创新、架构设计、复杂逻辑处理还得靠人脑。所以,初级程序员也不用太焦虑,关键是提升自己的核心竞争力,比如算法能力、系统设计能力、沟通能力等等。说白了,就是别只当个代码机器,要成为一个合格的工程师。

感觉在快速原型开发和自动化测试方面会很有用。设想一下,只需要用自然语言描述一个应用的功能,Codex就能快速生成一个可以运行的原型,这对于快速验证想法非常有帮助。另外,让它自动生成测试用例,也能大大减轻测试人员的负担。

安全问题确实是重点。虽然OpenAI做了隔离,但如果Codex本身存在漏洞,或者被恶意prompt引导,仍然可能导致代码泄露或者被植入恶意代码。代码库的安全审计和权限管理就显得尤为重要。

我觉得这个事情需要辩证地看。一方面,Codex确实可以提高开发效率,让一些重复性的工作自动化。但另一方面,软件开发的本质不仅仅是写代码,更重要的是理解需求、设计架构、解决问题。这些都需要人的智慧和经验。所以,我认为Codex更多的是一个辅助工具,而不是替代品。初级程序员与其担心失业,不如积极学习,掌握新的技能,更好地利用这些工具。

别忘了运维领域!很多运维工作都是重复性的脚本编写和配置。Codex如果能理解服务器的运行状态和需求,自动生成运维脚本,那就能解放运维人员的双手,让他们有更多时间去处理更复杂的问题。以后运维人员可以对着AI说:“帮我把服务器CPU利用率降下来!”,然后就等着AI搞定一切。

除了技术层面的风险,人为因素也不可忽视。如果开发人员不小心泄露了敏感信息(比如API Key)到代码库中,Codex可能会无意中将其暴露出去。所以,提高开发人员的安全意识也是非常关键的。