Claude Code推出“计算机操作”能力,引社区争议;OpenAI趁势发布插件

Claude Code开始“会用电脑”,OpenAI则用Codex插件直接切入其开发者生态。

原文标题:Claude Code刚放出大招,转眼就被群嘲“用不起”!OpenAl趁机甩出最阴插件,直接偷家

原文作者:AI前线

冷月清谈:

Anthropic 为 Claude Code 推出研究预览功能“Computer Use”,目前仅支持 macOS。它让 Claude 不再只停留在生成代码,而是能通过命令行结合图形界面操作电脑,完成编写、编译、运行、点击验证、截图、调试等一整套开发流程,覆盖原生应用、Electron、iOS 模拟器以及缺少 CLI/API 的工具场景。

技术上,这项能力建立在 Agent Loop 与内置 MCP 服务器之上。Claude 会在不同执行方式间做选择,GUI 操作更多作为兜底方案,以平衡通用性、效率和精度。权限方面采用按需授权,且以会话为单位生效,用户可看到将访问的应用、可能涉及的额外权限及对当前环境的影响,降低长期滥用风险。

社区反馈明显分化。认可者看重它让 AI“会用电脑”的意义,质疑者则集中吐槽成本高、token 消耗重、仅限 Mac、与既有产品定位存在混淆。不少用户担心,随着用户规模和任务复杂度上升,未来价格上涨、配额收紧可能是大概率事件。

同一天,OpenAI 发布 codex-plugin-cc,允许开发者在 Claude Code 中直接调用 Codex 进行代码审查、对抗性审查和任务接管。相比单纯兼容,这更像是在 Claude 生态里嵌入一个“第二意见系统”,显示出两家在开发者工具和工作流入口上的正面竞争。

怜星夜思:

1、如果 AI 编码工具真的能直接操作电脑、跑应用、点按钮做验证,你觉得开发者最先被改变的工作习惯会是什么?
2、文章里很多人吐槽这类功能“很酷但用不起”,你觉得 AI 开发工具未来更可能走向高价专业化,还是低价普及化?
3、OpenAI 把 Codex 插件放进 Claude Code,这种“在对手地盘上提供第二意见”的做法,你觉得是开发者受益,还是生态竞争会变得更混乱?
4、如果这类“会用电脑”的能力以后扩展到 Windows、Linux 甚至企业内网系统,你觉得最大的阻力会是技术问题,还是权限与安全问题?

原文内容

作者|冬梅

在各大厂狂卷开发者工具生态之际,Anthropic 也在频繁推出新工具。

北京时间昨天夜里,Anthropic 宣布在其开发工具 Claude Code 中引入一项极具突破性的能力——“Computer Use”(计算机操作能力)。这一功能目前以研究预览(research preview)形式在 macOS 平台上线,允许 Claude 直接通过命令行界面(CLI)操控用户计算机,实现从代码编写到应用验证的完整闭环。

Computer Use 正式可用

传统的 AI 编码工具,无论是 GitHub Copilot 还是早期的 Claude Code,本质上仍停留在“生成代码”的范畴——开发者需要手动完成编译、运行、调试、验证等步骤。而“Computer Use”能力的出现,彻底改变了这一流程。

    

根据 Anthropic 发布的技术说明,Computer Use 能处理 任何你通常需要离开终端手动完成的任务,例如:

  • 构建并验证原生应用:请 Claude 构建一个 macOS 菜单栏应用。Claude 会编写 Swift 代码,编译并启动它,并在你打开应用之前逐个点击每个控件进行验证,以确保其正常工作。

  • 端到端 UI 测试:让 Claude 打开本地 Electron 应用,并告诉他“测试用户引导流程”。Claude 打开应用,点击注册按钮,并截取每个步骤的屏幕截图。无需 Playwright 配置,也无需测试框架。

  • 调试视觉和布局问题:告诉 Claude “模态框在小窗口中显示不全”。Claude 调整窗口大小,重现问题,截图,修改 CSS,并验证修复效果。Claude 看到的问题与你看到的一致。

  • 仅支持 GUI 的工具:与设计工具、硬件控制面板、iOS 模拟器或没有 CLI 或 API 的专有应用程序进行交互。

这意味着,开发者无需离开终端,即可完成过去需要 IDE、浏览器、模拟器等多工具协作的复杂流程。更关键的是,这种能力并不限于 CLI 环境,而是覆盖所有需要 GUI 交互的场景,例如:

  • 原生 macOS 应用(如 SwiftUI)
  • Electron 桌面应用
  • 无 CLI 或 API 的专有软件
  • iOS 模拟器、设计工具等

换句话说,Claude 不仅“会写代码”,还“会用电脑”。

技术实现:基于 Agent Loop 与 MCP

从技术角度来看,“Computer Use”并非简单的自动化脚本,而是构建在完整的智能体(Agent)执行框架之上。

该能力通过一个名为 computer-use 的内置 MCP(Model Context Protocol)服务器实现。MCP 是 Anthropic 近年来重点推进的接口标准,用于统一模型与外部工具、数据源之间的交互方式。

在这一架构中:Claude 作为决策核心(模型)、CLI 作为交互入口、MCP 服务器作为工具调度层,本地系统作为执行环境。Claude 会根据任务自动选择最合适的执行路径:

这种“分层决策”机制,本质上是一种成本与效率的优化:GUI 操作最通用,但也是最慢、最不精确的方式,因此仅作为兜底方案。

在引入“computer-use”能力之后,Claude 对本地应用的调用方式并非完全开放,而是建立在一套以“会话为单位”的权限控制机制之上。这一机制的核心目标,是在提升自动化能力的同时,确保用户对系统访问范围拥有清晰、可控的边界。

首先需要明确的是,启用 computer-use 服务器,并不等同于允许 Claude 直接访问用户计算机中的所有应用程序。系统默认采取的是按需授权策略:只有当 Claude 在当前任务执行过程中,首次尝试调用某个具体应用时,才会触发权限请求流程。

在这一过程中,终端会弹出提示信息,向用户明确展示几项关键内容:其一,Claude 当前希望控制的具体应用名称;其二,该操作是否涉及额外权限请求,例如访问剪贴板等敏感资源;其三,在 Claude 执行相关任务期间,是否会对其他正在运行的应用产生影响,例如被隐藏或暂时不可见。

用户需要基于这些信息进行决策,选择“允许”或“拒绝”。这一授权行为具有严格的作用域限制——所有批准仅在当前会话期间有效,一旦会话结束,相关权限将自动失效,不会被长期保留或跨会话继承。这种设计有效降低了长期权限滥用的风险。

此外,当 Claude 在同一时间需要访问多个应用时,系统支持用户进行批量授权,从而减少频繁确认带来的操作负担。这一设计在多步骤任务或复杂工作流中尤为关键,可以在效率与安全之间取得平衡。

社区反馈两极分化

在 Reddit 社区中,这一新功能迅速引发了广泛而激烈的讨论。

有趣的是,用户情绪呈现出一种明显的分裂:一方面认可功能本身的技术价值,另一方面则对其现实可用性表达出强烈不满。

一部分用户认为该功能“概念上很酷”,但在当前使用限制之下几乎缺乏实际意义。

有评论直言,这类发布“显得不合时宜”,甚至在社区中形成了一种带有讽刺意味的共识——“很酷,但谁在乎?”点赞较高的评论集中批评 Anthropic 的产品策略,认为连付费用户的基础体验都未得到保障,更不用说尝试这种高消耗 token 的新能力。在他们看来,资源分配和优先级判断存在明显偏差。

与此同时,一些具体问题也被反复提及。例如,Windows 和 Linux 用户对该功能迟迟未覆盖表示不满,认为 Mac 优先的发布路径忽视了更广泛的开发者群体。此外,该用户也表示对不同产品形态之间的定位感到困惑。社区中较为一致的解释是:“Cowork”更像是桌面端的沙盒助手,用于处理常规任务;而“Computer Use”则是面向开发者的命令行工具,具备更深层的系统访问能力,主要服务于代码相关工作流。

还有一部分用户,则进一步延伸到了成本与商业模式问题。

有用户指出,当前的定价体系本质上处于“被补贴”的状态。一旦单位经济模型趋于稳定,价格结构很可能发生显著变化,例如更严格的分级套餐、更低的使用上限,以及针对重度用户的高价订阅(每月 50 至 100 美元甚至更高)。这种判断的依据在于:如今普通用户仅用每月 20 美元,就可以完成过去可能需要数万美元外包成本的工作。

在这一逻辑下,即便模型推理成本正在下降,总体支出仍可能持续上升——因为用户规模扩大、上下文长度增加,以及任务复杂度提升,都会不断推高整体算力消耗。因此,无论是提高价格、收紧配额,还是引入更多限制,在部分用户看来几乎是“不可避免”的趋势。

当然,也有声音以更直观的方式表达了当前的使用困境。有用户调侃称,也许未来某一天,自己能够攒够足够的 token,至少尝试一次这个功能,而不至于消耗掉整整一周的额度。

 OpenAI 同日发布新插件,

把手伸进 Claude 生态

值得注意的是,昨天 OpenAI 连夜也发布了一个新插件 codex-plugin-cc,能让开发者直接在 Claude Code 里调用 Codex 做代码审查、对抗性审查,甚至把任务整个移交给 Codex 执行。

从产品策略上看,这并不是简单的兼容或适配,而更像是一种“反向渗透”:Claude Code 已经形成了自己的插件生态,而 OpenAI 选择以官方身份入场,将 Codex 明确定位为工作流中的“第二意见系统”。它不直接接管主流程,而是在关键节点提供独立判断,形成一种带有对抗性的协作关系

这一插件(codex-plugin-cc)的设计非常克制,核心只提供三类命令,但覆盖了开发流程中最关键的风险点。

首先是 /codex:review,用于执行标准的只读代码审查。这一模式不修改代码,重点在于识别常规问题,例如代码质量、结构缺陷或潜在错误。

其次是 /codex:adversarial-review,这是插件中更具特色的能力。它并不满足于表层检查,而是主动挑战现有实现中的“隐藏假设”,例如边界条件、权限逻辑或系统耦合点。这类审查尤其适用于高风险场景,如系统迁移、鉴权机制调整或基础设施脚本变更,本质上是在用另一套模型思维对现有方案进行“压力测试”。

第三个命令 /codex:rescue 则更进一步——它允许开发者在任务陷入停滞时,直接将控制权交给 Codex,由其重新规划和执行。

OpenAI 推出的新插件,在 X 上引发了用户的广泛讨论。有用户表示,“直接告诉 Claude 用 Codex 执行器和 tmux,也是可以达到这种效果的,何必多此一举。”

但 OpenAI Codex 团队成员 Dominik Kundel 在该用户下方回复,可以自己去试试上述提到的方法。Dominik 的言外之意或许是:如果这样可以,那我们还做新插件干什么!

也有用户提出疑问,使用 Codex MCP 和这个新插件有什么区别?

Dominik 在评论区回复该用户时解答道:“Codex MCP 是一个更简洁但功能更有限的界面。该插件底层使用 Codex 应用服务器。它与 Codex 应用使用相同的协议,因此可以更方便地添加功能,例如从应用 /CLI 添加实际的审阅功能。由于它不是 MCP,因此也不会像 MCP 那样占用过多上下文窗口空间。如果 MCP 对您来说很好用,那就太好了!这是一个替代方案。”

参考链接:

https://code.claude.com/docs/en/computer-use

https://x.com/search?q=Claude%20code%20compute%20use%20&src=typed_query

https://x.com/sota0805/status/2038750897984204929

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

今日荐文

图片
你也「在看」吗?👇

这让我想起了工业革命。以前手工业者需要亲力亲为完成所有环节,但机器出现后,他们只需要操作机器,生产效率大大提高。AI 在软件开发中的作用也是如此。它能把开发者从繁琐的体力劳动中解放出来,让他们专注于更有创造性的工作。也许未来,软件开发会变成一种“人机协作”的模式,人类负责创意和战略,AI 负责执行和优化。

定价这玩意儿,说白了就是供需关系决定的。现在 AI 编码工具还处于推广阶段,所以价格相对较低,吸引用户。但随着用户规模扩大,算力成本上升,价格肯定会上涨。合理的定价模式应该是根据使用量、功能模块、服务等级等因素进行分层定价,让不同需求的开发者都能找到合适的方案。比如,轻度用户可以选择按需付费,重度用户可以选择包月或包年套餐。

这种策略其实挺常见的,毕竟开发资源有限,肯定要优先选择用户量大或者商业价值高的平台。macOS 在开发者群体里占比不小,优先支持也算合理。但如果长时间不覆盖其他平台,肯定会引起用户不满。希望 Anthropic 能尽快推出 Windows 和 Linux 版本吧!

定价这玩意儿,真是门玄学。按 token 收费感觉不太透明,容易让人觉得被割韭菜。订阅制可能更受欢迎,但如果用量超了,也得想想怎么处理。我觉得可以考虑分级定价,根据不同用户的需求提供不同的套餐,这样更灵活一些。

如果能跨平台,那简直是开发者的福音啊!想想看,不用在不同的操作系统之间切换,直接让 Claude 搞定各种环境下的编译、测试,效率肯定能提升一大截。不过,安全问题也得重视,给AI这么大的权限,万一被恶意利用,那可就麻烦了,感觉权限管理和监控必须跟上。

这其实是创新者的窘境。新的技术往往需要经历一个“炒作周期”,先是引起人们的极大兴趣,然后发现现实并没有那么美好,最后才能回归理性。AI 领域现在就处于这个周期中。我们需要保持乐观,但也要脚踏实地,解决 AI 实际应用中的问题。

从学术角度看,这代表着Agent在软件开发领域的深化应用。如果Computer Use足够稳定,它将极大地提高开发效率,降低debug成本。但要完全取代程序员我觉得还早,因为AI的创造性和解决复杂问题的能力还有待提高。更可能的场景是人机协作,AI负责执行,人负责决策和创新。

这个问题问得好!Anthropic 搞的这个分层权限控制,理论上是想在方便和安全之间找个平衡点。每次 Claude 想调用应用程序都要经过用户授权,听起来很美好。但实际用起来,可能还是会有风险。

1. 用户疲劳:如果 Claude 需要频繁请求权限,用户可能会变得麻木,不仔细看就直接点“允许”,这就给了 AI 可乘之机。
2. 社会工程学攻击:黑客可能伪装成正常的应用程序,诱导用户授权,然后利用 Claude 的能力执行恶意操作。想想看,如果 Claude 被骗去运行一个恶意脚本,那后果不堪设想。
3. 漏洞利用:任何软件都有可能存在漏洞,包括这个权限控制系统本身。黑客如果发现漏洞,就可以绕过授权机制,直接控制 Claude 进而控制用户的电脑。

如果我是黑客,我会这么做:

1. 信息搜集:先用 Claude 搜集目标用户的信息,比如常用的软件、工作习惯等,然后定制攻击方案。
2. 伪装攻击:编写一个看起来无害的脚本,诱导用户授权 Claude 运行,实际上这个脚本会偷偷安装后门或者窃取敏感数据。
3. 持续控制:一旦控制了 Claude,就可以利用它的“计算机操作”能力,悄无声息地监控用户的电脑,甚至进行更高级的攻击。

总之,这个功能虽然有潜力,但安全性方面还有待考量。我们在享受便利的同时,也要时刻保持警惕,不要轻易授权 AI 访问我们的电脑。

优先支持 macOS,我觉得有点“精英主义”的味道。Anthropic 可能认为 macOS 用户更具有付费能力,或者对新技术的接受度更高。但这种策略也可能会让他们失去一部分潜在用户。毕竟,Windows 和 Linux 的用户基数更大,而且很多企业级的应用都是部署在 Linux 服务器上的。如果 Anthropic 想在企业市场有所作为,就不能忽视这些用户。

其实我更关心的是,Anthropic 什么时候能把 Computer Use 功能移植到 Web 平台。现在很多开发工作都是在云端进行的,如果在浏览器里就能直接使用 Computer Use,那就太方便了。当然,这可能涉及到安全问题和技术挑战,但如果 Anthropic 能解决这些问题,就能在 AI 编码工具领域取得更大的优势。

从学术角度看,这代表了一种从“代码生成”到“智能体驱动开发”的范式转变。开发者需要更多地关注需求理解、架构设计和问题解决,而不是具体的编码实现。适应这种变化,需要开发者提升抽象思维能力、学习如何与 AI 协作,并掌握必要的 AI 调试和优化技能。同时,教育体系也应进行相应调整,培养具备 AI 素养的新一代开发者。

这就是典型的“降维打击”啊!你 Claude 辛辛苦苦搞生态,我 OpenAI 直接插一脚进来,让你用户用我的服务,数据也流向我这边。好处嘛,开发者可以获得更全面的代码审查,坏处就是… 你永远不知道 OpenAI 会不会哪天直接把 Claude 给“优化”掉。

OpenAI 这招有点像“木马计”。表面上是合作,实际上是在挖 Claude 的墙角。如果 Codex 插件足够好用,可能会有 Claude 用户倒戈到 OpenAI 阵营。当然,这也取决于 Claude 自身的实力,如果能保持领先,就不怕被别人渗透。

“大一统”的AI开发平台?不存在的。AI领域的技术发展太快了,今天领先,明天可能就被超越。而且,不同的开发者有不同的需求,不可能有一个平台能满足所有人的要求。百花齐放才是常态。OpenAI的插件只能算是锦上添花,改变不了大局。

我觉得是机遇大于威胁!引入 Codex 相当于给 Claude Code 增加了一个强大的“外脑”,可以提升代码质量和安全性。而且,这种“对抗性协作”模式,也能激发 Claude 不断进化,提升自身的能力。

说白了,鸡蛋不能放在一个篮子里!与其过度依赖 Claude Code,不如同时学习和掌握其他类似的工具和技术,保持技术的多元化。万一 Claude 涨价或者停止服务,也能迅速切换到其他方案。

如果真的能流畅运行,那绝对是生产力工具的革命!想想看,以后开发人员只需要给 Claude 下指令,它就能自动完成编译、测试、部署等一系列繁琐的操作,彻底解放双手,专心搞创意,真正实现“君子动口不动手”。

从更学术的角度来看,这标志着软件开发范式的转变,从手动编码到自动化流程编排。未来开发者可能更多地扮演“架构师”的角色,负责设计整体方案,而具体的实现则交给 AI。当然,这也对开发者的抽象能力和系统设计能力提出了更高的要求。

这事儿挺有意思的,有点像武侠小说里两个高手过招。OpenAI 这招“借力打力”很高明,既能扩大 Codex 的影响力,又能刺探 Claude 的技术底细,简直一箭双雕!