DeepSeek V3深夜升级,代码能力直逼Claude 3.5/3.7 Sonnet

DeepSeek V3升级,代码能力媲美Claude 3.5/3.7 Sonnet,开源免费且API更便宜,前端开发能力显著增强。

原文标题:DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

原文作者:数据派THU

冷月清谈:

DeepSeek V3 近日低调升级至「DeepSeek-V3-0324」版本,并采用了更宽松的 MIT 开源协议。尽管模型卡信息有限,但其代码能力已引发广泛关注。用户测试表明,DeepSeek-V3-0324 在数学推理和前端开发方面表现出色,甚至优于 Claude 3.5 和 Claude 3.7 Sonnet。有博主分享了使用该模型创建响应式网页的案例,展示了其在 HTML5、CSS 和前端方面的强大能力。此外,DeepSeek-V3-0324 在编写代码方面的卓越表现,使其在开源选择中脱颖而出,媲美 Claude 系列。更有用户通过测试发现,DeepSeek-V3-0324 具备一定的思维链模型特性,并展示了其在生成小球效果方面接近 OpenAI o1-pro 的性能,但成本更低。综合来看,DeepSeek-V3-0324 在代码生成和前端开发方面取得了显著进展,成为一个极具竞争力的开源模型。

怜星夜思:

1、DeepSeek V3这次升级主要提升了代码能力,那除了代码,大家觉得它在哪些其他方面还有提升空间?或者说,你希望它未来在哪些方面有所突破?
2、DeepSeek V3这次升级后开源协议更加宽松,这对开发者来说是好事。但宽松的开源协议也可能带来一些安全风险,比如被恶意利用。大家怎么看待开源协议的利与弊?
3、文章里提到DeepSeek V3能生成响应式网页,前端能力很强。现在前端技术日新月异,各种框架层出不穷。你认为AI在前端开发中能发挥多大的作用?未来前端工程师会被AI取代吗?

原文内容

来源:机器之心
本文约1000字,建议阅读5分钟
DeepSeek V3 升级到了「DeepSeek-V3-0324」版本。


近日,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。

目前,新版本在 Hugging Face 上可以下载并部署。

  • Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

不过,DeepSeek-V3-0324 没有公布详细的模型卡。我们只能看到它的参数为 6850 亿以及张量类型。
此外,DeepSeek-V3-0324 支持了更宽松的 MIT 开源协议。
模型放出来后,DeepSeek-V3-0324 的代码能力让所有人震惊了!
有人表示,经过自己的测试,DeepSeek-V3-0324 在数学推理和前端开发方面的表现优于 Claude 3.5 和 Claude 3.7 Sonnet。
图源:https://x.com/selcukemiravci/status/1904311856313028870
X 博主「@KuittinenPetri」表示,Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以轻松免费地创建漂亮的 HTML5、CSS 和前端。
图源:https://x.com/KuittinenPetri/status/1904224441384771909
提示词如下:为 AI 公司「NexusAI」创建一个外观精美的响应式首页,将所有内容包含在一个 HTML5 文件中。结果如下图所示,所有图像,包括用户故事和他们的面孔,一切都是用这个提示完成的。 
他认为:DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,通常更适合创意写作任务,但现在也比 R1 更适合制作 HTML5 + CSS + 前端。上述提示的结果代码总共 958 行,但它实际上实现了一个交互式网站,包括所有图像。并且结果也适用于移动设备。
他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。
另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。
图片
这位网友还把提示语放出来了,简单的几行字,大家可以前去一试。
Hyperbolic 联合创始人兼 CTO Yuchen 称自己的氛围测试显示,DeepSeek- V3-0324 已经有了一些思维链模型的影子。
他测试了题目「strawberry 中有多少个 r」,可以看到,DeepSeek-V3-0324 展示了详细的推理步骤。他表示,真正的「Open AI」又赢了。
图片
图源:https://x.com/Yuchenj_UW/status/1904223627509465116
还有人将 DeepSeek-V3-0324 与 OpenAI o1-pro 生成小球的效果进行了比较。下面是 o1-pro 的效果:
图片
他表示,DeepSeek-V3-0324 大约可以实现 o1-pro70% 的性能,但它免费并且 API 价格比后者便宜了至少 50 倍。二者选谁一目了然!
图片
图源:https://x.com/michaelkaoi/status/1904178015833297342
X 博主「orange.ai」对 DeepSeek V3、DeepSeek-V3-0324 与 Claude Sonnet 3.7 的海报设计结果进行了比较,同样表示前端代码能力相比上代有了显著增强。
图源:https://x.com/oran_ge/status/1904306405823467526
编辑:文婧



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


前端er表示瑟瑟发抖… 不过话说回来,AI再强,也只是工具。关键在于我们如何利用它。与其担心被取代,不如拥抱变化,学习如何与AI协同工作,提升自己的核心竞争力。

从法律角度来说,开源协议本身也是一种约束。虽然宽松,但并非没有底线。恶意利用开源技术,同样要承担法律责任。所以,关键在于完善法律法规,加大监管力度。

作为一个略懂前端的后端,我觉得AI能大大降低前端开发的门槛。以后后端同学也能快速上手写一些简单的页面了,前端同学可以把更多精力放在用户体验和性能优化上。

作为一个学术派,我更关注模型的泛化能力。DeepSeek V3在特定任务上表现出色,但如果能更好地迁移到其他领域,比如自然语言处理、图像识别等,就能发挥更大的价值了。

AI在前端开发中的潜力是巨大的!它可以辅助完成重复性工作,提高开发效率。但要完全取代前端工程师,我觉得还不太可能。毕竟,前端开发不仅仅是写代码,还需要与设计师、产品经理沟通,理解用户需求,这些都是AI目前难以做到的。

开源双刃剑嘛!宽松的协议降低了使用门槛,加速技术普及,但确实也增加了潜在风险。关键在于社区的监督和参与,及时发现和修复漏洞,共同维护开源生态的安全。

我觉得吧,现在AI大模型在创意生成方面都挺卷的,DeepSeek V3如果能在prompt理解上更进一步,在艺术设计方向发力,没准能开辟新赛道。毕竟免费又好用,谁不喜欢呢?

我觉着安全问题不用太担心,毕竟技术本身是中立的。关键在于使用者的道德水平。只要大家遵守规则,不作恶,开源就能发挥积极作用。

个人觉得,DeepSeek V3在生成代码这块确实亮眼。但如果能进一步提升对复杂业务逻辑的理解能力,那就更香了。比如,让它能根据需求文档自动生成整个项目的框架,而不仅仅是单个页面,那绝对是开发者的福音!