阿里开源Qwen3-Coder,编程能力比肩Claude,高效开发新选择!
原文标题:刚刚,阿里开源Qwen3-Coder,Claude级别编程模型
原文作者:机器之心
冷月清谈:
怜星夜思:
2、Qwen3-Coder在Agent能力上表现很强,甚至超越GPT-4.1,这在实际应用场景里意味着什么?未来它能帮我们解决哪些以前觉得很棘手的编程任务?AI Agent的边界到底在哪里?
3、阿里这次把Qwen3-Coder这样级别的模型开源了,直接对标Claude。大家觉得,在编程大模型这个领域,开源和闭源模式的竞争会怎么发展?开源的优势真能完全碾压闭源吗,还是各有其道?
原文内容
阿里开源,又开始卷起来了!
刚刚,阿里发布了 Qwen3-Coder,这次直接在编程能力上登顶全球开源模型,更厉害的是还超越了 GPT-4.1 这种闭源模型,能和 Claude 4 这个目前最强的编程模型平起平坐。
最让人兴奋的是它的实际效果 —— 据说新手程序员用它一天就能完成资深程序员一周的工作量,生成一个品牌官网最快只需要 5 分钟。这效率简直颠覆认知。
从技术角度看也很有意思,这是千问系列首个采用混合专家 MoE 架构的代码模型,总参数达到 480B 但只激活 35B 参数,原生支持 256K token 上下文,还能扩展到 1M 长度。它用 7.5T 数据预训练,其中 70% 都是代码,难怪编程能力这么强悍。
Agent 能力方面的表现更是亮眼。在 WebArena(浏览器调用)和 BFCL(工具调用)这些 Agent 评测中,Qwen3-Coder 直接刷新了开源模型记录,甚至超越了 GPT-4.1。在 SWE-Bench 这个考察模型自主解决编程任务的评测里,也拿到了开源最佳成绩,能媲美 Claude 4 的水平。
最实用的还是它解决复杂长任务的能力,能够统筹全局自主规划,调用各种工具深入研究问题。实测显示它能调用的工具数量比 Claude 多好几倍,效果相当出色。业内已经有人说开源的 Qwen3-Coder 可能要取代昂贵的 Claude,成为 Agent 领域最受欢迎的编程模型。
目前,它已经在魔搭社区、HuggingFace 等平台开源了,全球开发者都能免费使用。很快还会接入通义灵码,API 也上线了阿里云百炼。
阿里还专门开源了命令行工具 Qwen Code,能更好发挥代理式编程的潜力。而且 API 可以和 Claude Code、Cline 这些工具协同使用。
一直以来,Claude 都是编程大模型领域的天花板。此次阿里开源这种级别的编程模型,你怎么看?欢迎已经用上的同学们评论。