谷歌 Gemini CLI 发布:免费配额挑战 Claude,开源生态加速崛起

谷歌发布 Gemini CLI,免费使用额度高,开源且功能强大,挑战 Claude 在代码生成领域的地位。开发者反馈 Gemini 在某些任务上已超越 Claude。

原文标题:一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了

原文作者:AI前线

冷月清谈:

谷歌发布 Gemini CLI,这款 AI 助手在终端环境下运行,并提供了慷慨的免费使用配额,引发行业关注。Gemini CLI 不仅提供代码编写、问题调试等功能,还能连接 MCP 服务器,具备 Agentic AI 能力。与 Claude Code 不同,Gemini CLI 是开源的,并在短时间内获得了大量关注。谷歌强调,Gemini CLI 接入的是通用模型 Gemini 2.5 Pro,而非专门的代码模型,这是因为编码任务往往需要模型理解上下文、具备常识。谷歌通过挖掘内部工程师资源和探索 agentic 编程模型,不断提升 Gemini 在代码生成和理解方面的能力。有开发者表示,Gemini 在某些任务上的表现已经超过 Claude,预示着谷歌在 AI 编程领域正在迎头赶上。

怜星夜思:

1、Gemini CLI 提供的超大免费配额,会对 Claude 等同类产品产生怎样的影响?这种免费策略是否可持续?
2、文章提到 Gemini CLI 使用的是通用模型 Gemini 2.5 Pro,而不是专门的代码模型,你认为这种选择的优缺点是什么?
3、谷歌强调通过挖掘内部工程师资源来提升 Gemini 的代码能力,你认为这种方式有哪些优势和局限性?对于其他公司,这种方式是否具有借鉴意义?

原文内容

编辑 | Tina

今天,谷歌正式发布了 Gemini CLI ,这是其 AI 助手在终端环境下的一个版本。这款工具的亮点在于其非常慷慨的免费使用配额:它支持每分钟 60 次、每天 1,000 次的模型调用。

   免费配额“开挂”,
逼疯 Claude?

继 2 月的 Claude Code 和 4 月的 OpenAI Codex CLI 之后,谷歌也在 6 月推出了 Gemini CLI。至此,三大 AI 实验室都已发布了各自的“终端智能体”工具——这类 CLI 工具可以读取、修改文件,并在终端中代表用户执行命令。

估计不少人原本以为这类终端工具会一直是一个小众方向,但现在看来这是低估了它的潜力——不少开发者每月在 Claude Code 上的花费高达数百美元 ,说明这个“小众市场”其实比预想中大得多、也重要得多。

相对 Claude Code,谷歌在价格方面可谓“豪横”:

使用个人 Google 账号登录,即可免费获得 Gemini Code Assist 许可。这将解锁 Gemini 2.5 Pro 模型和百万 token 上下文窗口。在此次预览期间,谷歌提供业界最宽松的调用配额:每分钟最多 60 次、每天最多 1000 次请求,全部免费。

目前来看,社区对 Gemini CLI 的关注重点集中在其超大免费配额上。评论者直言:“太夸张了,这会给 Anthropic 带来巨大压力。”“确实如此——如果这些调用限制是真的而且免费,那终于有真正的竞争了。”

与 Claude Code 不同,Gemini CLI 和 OpenAI Codex CLI 一样是开源的(使用 Apache 2.0 许可)。并且 Gemini CLI 在不到一天的时间里,获得了 15.1k 星。

Gemini CLI 提供的功能包括代码编写、问题调试、项目管理、文档查询以及代码解释。它还连接了 MCP(模型上下文协议)服务器,具备 Agentic AI 能力。

CLI 工具的优势在于,它可以与任何编辑器或 IDE 搭配使用,而不局限于特定插件支持的工具;同时还支持多实例并发运行。部分开发者也认为,命令行交互效率更高。

Gemini CLI 支持 Mac、Linux(包括 ChromeOS)和 Windows 平台。与 Claude Code 或 Codex 不同的是,Windows 上为原生实现,无需依赖 Windows 子系统(WSL)。开发者可以通过在项目根目录添加一个名为 gemini.md 的文本文件来自定义上下文和参数。谷歌高级工程师 Tayor Mullen 表示,当 CLI 检测到“值得长期保存的细节”时,也会自动将其写入该文件。

因为整体开源,所以我们还可以看到它的 system prompt。

一如既往,这份系统提示词不仅定义了工具行为,也是一份非常精炼准确的使用文档。比如它对代码注释的原则是:

注释: 请谨慎添加注释,重点说明“为什么”要这么做,尤其是处理复杂逻辑时,而不是解释“做了什么”。只有在确实能提升可读性或用户明确要求时,才添加高价值注释。请勿修改与你更改无关的注释,也绝不要通过注释与用户交流或说明你的更改

系统默认使用的技术栈也颇有参考价值。

如果用户没有指定技术偏好,默认建议如下:

  • Web 前端: React(JavaScript/TypeScript)+ Bootstrap CSS,结合 Material Design 设计规范;

  • 后端 API: Node.js + Express.js 或 Python + FastAPI;

  • 全栈应用: Next.js(React/Node.js)+ Bootstrap + Material Design,或 Python(Django/Flask)+ React/Vue.js 前端;

  • 命令行工具(CLI): Python 或 Go;

  • 移动 App: Compose Multiplatform(Kotlin)或 Flutter(Dart),用于跨平台开发;也支持 Jetpack Compose(Android)或 SwiftUI(iOS)原生开发;

  • 3D 游戏: HTML/CSS/JavaScript + Three.js;

  • 2D 游戏: HTML/CSS/JavaScript。

胜过专用,
Gemini CLI 靠什么?

Gemini CLI 接入的是谷歌最先进的编码与推理模型 Gemini 2.5 Pro,具备代码理解、文件操作、命令执行和动态故障排查等能力,全面提升命令行的使用体验。用户可以通过自然语言编写代码、调试问题,并优化工作流程。

不仅如此,Gemini CLI 还能基于 MCP 调用其他谷歌服务,在终端中生成图像或视频,实现从编码到创作的一体化体验。

在发布会上展示的一体化演示和背后的技术理念,其实揭示了 Gemini CLI 的关键定位——它不仅是一个写代码的工具,而是一个连接多模态智能、打通编码与创作的“终端智能体”。这一理念也体现在背后所依赖的 Gemini 2.5 Pro 模型选择上。

值得注意的是,Gemini 2.5 Pro 本身并不是为代码任务特别训练的“代码专用模型”,而是一个覆盖更广泛能力边界的通用模型。那么,为何谷歌没有像某些竞争对手那样,专门为 Gemini CLI 打造一个定制化的代码模型?在一场深度访谈中,产品负责人 Connie Fan 和研究负责人 Danny Tarlow 分享了他们的思考。

Connie Fan 表示,虽然特定任务确实可以从专用模型中受益,例如 Cursor 训练的代码补全模型“在非常窄的用例里做得非常好”,但她强调,对于大多数现实世界中的开发任务而言,编码需求往往不局限于代码本身。

例如她提到的一个经典“vibe check”请求:“帮我做一个泰勒·斯威夫特歌曲排行榜 app”——这就需要模型不仅懂代码,还要理解上下文、具备常识,甚至有些 UI/UX 审美。“这些常识背后其实是用户真实的编程需求”,她总结说,“大多数通用任务,并不能从一个纯代码模型中受益。”

Danny Tarlow 则进一步指出:“代码专用模型到底意味着什么?‘代码’已经不仅仅是代码本身,它涵盖了软件开发过程中的各种环节,涉及多种信息源,有些专属于代码,有些则不是。如果只强化代码能力而削弱其他能力,反而会限制模型的表现。我们更倾向于通用模型上的协同发展,寻求不同能力之间的融合和平衡,打造一个‘通才型’模型,这才是更优的发展路径。”

实际上,现在已经有越来越多开发者开始注意到 Gemini 2.5 Pro 在代码生成和理解方面的显著提升。

在 Claude 长期占据主导的讨论氛围中,不少人也开始发出“Gemini 要逆袭了吗?”、“Google 要翻盘了吗?”的声音。社交媒体上,有用户分享了一些开发体验:在一个约 50 万行代码规模的项目中,使用 Claude Code 生成的代码质量“远远不如 cline + Gemini 2.5 Pro”,要达到同等效果,Claude 需要开发者全程盯着。

还有开发者表示,在 Trae 上使用 Gemini 2.5 Pro 编程的完成率已经大幅超过 Claude 3.7。也有开发者表示 Gemini 修复 bug 的速度明显快于 Claude Code。

一个 3D 渲染的处理问题,让 Claude Code 修了两个小时的 bug 还没解决,结果问 Gemini 2.5 Pro,只用了 5 分钟就搞定了。感觉对于那些看起来难度比较高的问题,可以先让 Gemini 写好详细的说明书,然后再让 Claude Code 按照它来实现,这种组合用法可能会挺不错的。

这些反馈表明,过去一年,谷歌在代码能力上的提升已经进入“质变期”。 Gemini 编码产品负责人 Connie Fan 表示,Gemini 2.5 Pro 之所以能获得良好口碑,关键在于两个方面的系统性演进:“数据”和“方法论”。

从数据的角度看,“代码仓库上下文”变得非常关键。现在模型的目标不再只是做简单的代码补全,而是要理解并修改分布在多个文件、涉及多个模块的大型代码库:“模型要能完成那些你如果花一小时坐下来,在熟悉的代码库上下文中亲自去做的复杂改动。”

为了让模型真正理解这些上下文,谷歌也开始系统性地挖掘内部工程师资源。

其中还包括 Jeff Dean 这样的一些人,“他们代表了一种‘能力新等级’的标准,”Connie 直言,“我们拥有世界上最聪明、最出色、有时也最有主见的十几万工程师。”借助他们在不同语言、技术栈、经验水平上的反馈,谷歌能够覆盖更广泛的使用场景,提升模型在“专业开发者细腻口味”上的匹配能力。“我们过去其实并没有很好地利用这一点,但现在我们开始真正这样做了,而且效果非常惊人。”

从研究角度看,Gemini 团队并未将全部筹码押在“单一大上下文窗口”的方案上,而是探索双路线:一方面持续扩展上下文长度,另一方面发展具有自主搜索、推理能力的 agentic 编程模型,模型以代理的形式与用户交互,甚至具备一定程度的自主性。

正如研究负责人 Danny Tarlow 所描述:

“如果我们把你(人类开发者)丢进一个大代码库里,你会怎么做?你会用代码搜索、看文件结构、点来点去,读点代码再搜索其他信息。agentic 模型就模仿了这种方式。”

更有趣的是,当模型成功处理一个百万行代码库时,用户会感受到一种“魔法般”的惊喜。而这正是 Gemini 2.5 Pro 所在意的方向:不仅是模拟人类的工作方式,更是突破人类经验限制,发展出“非人类”的全新解法。

正因如此,不少开发者开始转而重视起谷歌在这场 AI 编程竞赛中的回归。Gemini 是否“翻盘”尚未可知,但“赶超”的信号,正在越来越清晰。

参考链接:

https://www.youtube.com/watch?v=jwbG_m-X-gE

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

活动推荐

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!


今日荐文

图片

你也「在看」吗?👇

谷歌这个做法挺聪明的,相当于请了一堆“代码顾问”来给 AI 调教。优势很明显,能让模型更懂程序员的需求,更贴近实际开发场景。但局限性也很明显,容易受到工程师个人经验和偏见的影响,可能导致模型生成“工程师味儿”太浓的代码。其他公司可以借鉴,但要避免过度依赖内部资源,最好能引入外部开发者参与评估和反馈。

这让我想起了“集体智慧”这个概念。让大量工程师参与到模型的训练和评估中,可以有效地发现模型的不足,并提出改进建议。但关键在于如何有效地组织和管理这些工程师,如何确保他们提供的反馈是高质量的、具有代表性的。如果管理不当,反而会适得其反。

从知识管理的角度来看,这是一种非常有效的知识转移方式。通过让 AI 模型学习内部工程师的知识和经验,可以有效地将这些知识固化下来,避免因人员流动而造成的知识流失。对于其他公司,尤其是那些拥有大量技术积累的公司,这种方式具有很高的借鉴意义。

这个问题问得好!Gemini CLI 的免费策略短期内肯定会对 Claude 造成冲击,毕竟免费的午餐谁不爱?但长期来看,免费策略是否可持续取决于谷歌的商业模式和盈利预期。如果谷歌能通过其他方式(比如企业服务、高级功能)实现盈利,那免费策略就能一直维持下去。否则,可能后面会调整收费标准。

这个问题很有深度!使用通用模型的好处是,它可以更好地理解自然语言,处理更复杂的任务,比如文章中提到的“vibe check”请求。但缺点是,在代码生成方面可能不如专门的代码模型那么精准和高效。这就像一个全科医生和一个专科医生,全科医生知识面广,但专科医生在特定领域更专业。

我认为通用模型更符合未来的发展趋势。代码不仅仅是代码,它涉及到上下文、常识、UI/UX 等多个方面。通用模型可以更好地理解这些信息,从而生成更符合用户需求的解决方案。而且,通用模型还可以不断学习新的知识和技能,适应不断变化的需求。

从工程角度来看,通用模型更像是一个“瑞士军刀”,啥都能干,但啥都不是最专业的。专用模型就像一个定制工具,只能干特定的活,但干得又快又好。选择哪种模型,取决于你的需求。如果你需要处理各种各样的任务,那通用模型更适合你。如果你只需要专注代码生成,那专用模型可能更高效。

从商业角度分析,这种高额免费很可能是为了快速抢占市场份额,培养用户习惯。一旦用户对 Gemini CLI 产生依赖,即使未来收费,用户也很难轻易切换。这种策略在互联网行业很常见,像之前的各种打车软件、外卖平台都是这么做的。至于可持续性,就看谷歌的财力够不够雄厚了。

我觉得这就像互联网早期的价格战,短期内用户肯定会涌向免费或低价的产品。但长期来看,用户最终还是会选择服务更好、体验更佳的产品。如果 Claude 能在功能和性能上保持领先,还是有机会留住用户的。当然,如果 Claude 也开始降价,那就热闹了。