Cursor 上线 Claude Max:更强智能,更高成本

Cursor 新上线 Claude Max 模式,基于 Claude 3.7,拥有更大上下文窗口和工具调用次数,适合复杂项目。按使用量计费,编程也要“氪金”?

原文标题:Cursor重磅上线Claude Max,工具调用一次0.05美元,充值实测一波

原文作者:机器之心

冷月清谈:

AI 编程工具 Cursor 推出了 Claude Max 模式,该模式基于 Claude 3.7 Thinking 模型,拥有 200K 上下文窗口和 200 次工具调用限制,适合处理大规模代码和复杂逻辑。然而,Claude Max 采用按使用量计费的方式,每次请求和工具调用均收费 0.05 美元,可能会带来较高的使用成本。文章通过小球碰撞、3D 赛车游戏和 AI 记账 App 的实际案例,展示了 Claude Max 在物理模拟、应用开发等方面的强大性能。但同时指出,Claude Max 在生成代码时可能存在中断和报错,仍有改进空间。

怜星夜思:

1、Claude Max 采用按使用量计费的方式,大家觉得这种模式对于 AI 编程工具来说是好是坏?会不会影响你使用它的意愿?
2、文章中提到 Claude Max 在生成代码时可能会出现中断和报错,你认为目前 AI 编程工具在代码质量方面还存在哪些不足?
3、文章展示了 Claude Max 在 3D 模拟赛车和 AI 记账 App 开发方面的应用,你觉得 AI 编程工具未来在哪些领域有更大的应用潜力?

原文内容

机器之心报道

编辑:侯江龙、陈陈

用的多,花的多,账单如流水。

AI 编程神器 Cursor 新鲜出炉 Claude Max 模式(MAX 代表了最大智能)!这波操作有点猛。

其核心优势在于处理大规模代码和复杂逻辑时表现出色,适合硬核开发者和大型项目。


Claude Max 是 Claude 3.7 的一种更强大配置,它以 Claude 3.7 Thinking 模型为基础。具有超强的创造力,能在其他模型失灵时脱颖而出,解决更复杂、更精妙的任务。

其次,它的上下文窗口高达 200K,这意味着你可以尽可能多地将代码放入提示中。以前的模型在处理这类任务时表现不佳,但 Claude 3.7 是第一个在处理如此大的上下文窗口时表现更好的模型。

此外,Claude Max 将工具调用限制提高到了 200 次,这意味着它可以一次性进行大量编辑,并在整个代码库中收集上下文! 

最后,它可以一次性读取更大块的代码。

不过,想要尝试的小伙伴要悠着点了,可能一个不小心就榨干你的钱包,因为 Claude Max 收费不包含在标准 Pro 订阅中,每次请求和工具调用均需支付额外的费用:即采用按使用量计费的方式,每次请求(prompt)收费 0.05 美元,每次工具调用收费 0.05 美元;对于大多数用户来说,可能不值得花费这些钱。

如果不加以控制,Claude Max 在完成其可用的 200 次工具调用后,可能会花费你 10 美元。

只能说,复杂点的项目可以尝试一下,一般项目用其他模型应该就够用了。

现在,X 上已经有用户在晒使用体验了。

视频来源:https://x.com/MervinPraison/status/1901876045185159295

不过,很多人还是被它的高收费劝退了:谁能想到,以后编程也要氪金了。


「自己让 Claude Max 帮我改完代码后,xcode 出现了一万多个报错。」


还有网友抱怨一个任务跑下来,花费自己十几块钱。


「调用工具 0.05 美元 一次,有时候一轮下来至少调 20 次工具。真是用不起。」


效果到底咋样,机器之心上手体验了一番。

一手体验

要使用「黑科技」Claude 3.7 Max,首先需要安装它。目前直接从官网的界面中点击下载的版本(0.47.5)是找不到对应的 Max 模式的。


因此这里在安装它的时候需要从 Cursor 官网中的「ALL Downloads」列表中手动查找并下载最新版本,经测试版本为 0.47.8 的 Cursor 支持 Claude 3.7 Max。


在安装完对应版本的 Cursor 之后,便可进入到交互界面。


接下来我们来感受一下 Claude Max 的强大编程性能,我们先来通过一个小球碰撞测试,将 Claude Max 与其他模型进行对比,来测试一下小球碰撞的物理模拟效果。

提示词:编写一个 Python 程序,显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。

图片

为了验证 Claude Max 在物理模拟中的表现,我们运行了由其生成的代码,整个过程耗时约 20 多秒。

图片

通过观察小球的运动轨迹,可以直观感受到 ChatGPT-4.0 和 Claude Max 对重力和摩擦力模拟的差距,这一对比结果从侧面反映出 Claude Max 在代码编程上有着出色的表现。

接下来,我将测试场景转向了更为复杂的 3D 模拟赛车游戏,同样基于 Claude Max 版本进行,以下是该测试的结果输出展示。

提示词:为我构建一款 3D 模拟赛车,让我在场景中感受驾驶。

图片

此次生成过程大约持续了 3 - 5 分钟,现在就让我们一同来检验一下生成的效果如何吧。

图片

虽然生成过程有点长,但令人意外的是,生成的 3D 模拟赛车游戏具备同时切换多种视角的功能。

事实上,Claude 系列带给我们的惊喜远不止于此。前几天就有网友借助 Claude 成功打造出一款简单又好玩的 3D 赛车游戏。

图片

Claude 3.7 Max 的另一大优势是强大的应用开发能力,这为我们提供了无限的想象空间。例如,我们可以让 Claude 3.7 Max 生成一个 AI 记账 App,用的是 Agent 模式,以下是输出结果展示。

提示词:请帮我从 0-1 编写一个记账 App。

图片

整个过程耗时 8 分钟左右,以上动图有适当加速。


而且生成过程中会有中断,我们需要通过提示词继续让 Claude Max 进行输出才能生成完整的代码文件。值得一提的是,在测试过程中曾遇到报错,经过个人调试后才成功实现了如上图所示的结果。

总体而言,这次体验基本顺利,Claude Max 的表现有令人惊喜之处。它不仅能够辅助程序员进行应用开发,还能优化个人的财务规划。然而,距离完全智能化仍有改进空间,期待未来的进一步优化与提升。

参考链接:
https://forum.cursor.com/t/claude-3-7-max-out-now/65698/6



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


我倒是觉得在教育领域会有一些意想不到的应用。比如,AI 可以根据学生的学习情况,自动生成个性化的编程练习题,甚至可以像一个 tutor 一样,指导学生学习编程。这样可以大大降低编程学习的门槛,让更多的人能够掌握编程技能。当然,这需要 AI 具备更强的理解能力和沟通能力。

嗐,说白了还是得看效果。如果 Claude Max 真的能大幅提升编程效率,减少 bug,甚至能让一些非程序员也能快速开发应用,那就算贵点也能接受。但如果只是噱头,或者提升的效果不明显,那肯定没人愿意买单。就怕最后变成“氪金才能变强”的局面,那就有点变味了。

我觉得在游戏开发领域潜力巨大。AI 可以辅助生成游戏场景、角色动画、甚至游戏剧情,大大缩短游戏开发周期。另外,在企业级应用开发方面,AI 也可以帮助快速搭建原型系统,自动生成 API 接口,提高开发效率。当然,前提是 AI 能够更好地理解业务需求,生成高质量的代码。

我觉得这种模式有点像“专家号”,把更高级的功能和服务单独拿出来收费,针对的是有特定需求的专业人士。对于普通用户来说,可能还是会选择更经济实惠的方案。不过,这种模式也有利于 AI 公司更好地进行成本控制和资源分配,从而提供更优质的服务。

在科研领域也有很大的应用潜力。AI 可以帮助研究人员快速搭建实验环境,自动分析实验数据,甚至辅助提出新的科学假设。例如,在生物信息学领域,AI 可以帮助分析基因序列,预测蛋白质结构,加速新药研发。这方面的应用,我觉得很有想象空间。

从我个人的经验来看,AI 编程工具生成的代码,有时候虽然能解决问题,但代码风格并不优雅,可读性比较差。而且,对于一些比较复杂的业务逻辑,AI 生成的代码可能存在隐藏的 bug 或者性能问题,需要人工进行大量的测试和调试。感觉现在的 AI 更多是辅助我们完成一些重复性的工作,真正要写出高质量的代码,还是得靠程序员自己。

我觉得现在 AI 编程工具最大的问题是缺乏“创造性”。它们可以根据现有的代码模式生成新的代码,但很难提出新的架构设计或者算法优化方案。所以,对于一些创新性的项目,AI 的帮助可能就比较有限。当然,这可能也是 AI 发展的一个必然阶段,未来随着技术的进步,AI 可能会变得更加“聪明”。

AI 编程工具的代码质量问题,很大程度上取决于训练数据的质量和模型的泛化能力。如果训练数据中存在大量的低质量代码,或者模型对特定类型的代码过度拟合,那么生成的代码质量自然会受到影响。另外,AI 在理解代码的上下文和语义方面还存在一定的局限性,导致生成的代码可能不符合实际需求。

这得分情况看吧。如果只是写一些简单的脚本或者小项目,那肯定不太划算,毕竟现在很多免费或者订阅制的 AI 工具也够用了。但如果是大型项目,需要处理复杂的逻辑和大量的代码,Claude Max 的优势就体现出来了,效率提升带来的价值可能远大于成本。至于我个人,如果成本可控,我愿意尝试一下,毕竟能提高效率才是最重要的。