DeepSeek-R1 横空出世,登顶美国App Store榜首,性能比肩OpenAI,成本却低得惊人!

国产大语言模型DeepSeek-R1爆火,超越ChatGPT登顶美区App Store榜首,性能强悍且成本低!

原文标题:DeepSeek爆火!反超ChatGPT,登顶美国苹果免费App榜首

原文作者:图灵编辑部

冷月清谈:

国产大语言模型DeepSeek 最新推出的推理模型 DeepSeek-R1 席卷全球,登顶美国App Store免费榜,超越ChatGPT。DeepSeek-R1 凭借其强大的推理能力和极低的开发及使用成本,引发了广泛关注。
DeepSeek-R1 在后训练阶段大规模使用强化学习技术,使其在数学、代码、自然语言推理等任务上的性能比肩 OpenAI o1 正式版。值得注意的是,DeepSeek-R1 的模型训练成本仅为 550 万美元,并且已经开源。
在使用成本方面,DeepSeek-R1 也极具优势。与 OpenAI 相比,DeepSeek-R1 的输入和输出成本都大幅降低,例如100万 tokens 的输入,OpenAI 需要 55 元,而 DeepSeek 只要 1 元。
除了 DeepSeek-R1-Zero 和 DeepSeek-R1 之外,DeepSeek 还开源了六个基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏得到的密集模型(1.5B、7B、8B、14B、32B、70B),用户可以直接部署在自己的电脑上。其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
DeepSeek 的成功与其独特的研发模式密不可分。创始人梁文峰专注于招募高校应届博士生,鼓励员工自由使用计算资源进行创新研究,这与硅谷大型 AI 公司依赖资深专家、注重快速商业化的模式形成了鲜明对比。DeepSeek 的案例表明,在有限的条件下,通过灵活的资源调配和团队的创新精神,同样可以取得突破性的成果。

怜星夜思:

1、DeepSeek-R1 的开源对AI社区会产生哪些影响?
2、DeepSeek 的低成本研发模式是否可复制?
3、DeepSeek-R1 的未来发展前景如何?它能否持续挑战 OpenAI 的地位?

原文内容

继小红书风靡全球后,国产大语言模型 DeepSeek 又在全球范围内引起轰动。这个周末简直被 DeepSeek 刷屏了,距离去年底发布 DeepSeek—V3 模型还没过去多久,他们又推出了一款新的推理模型 DeepSeek—R1。直接引爆外网,不少网友称它为“神秘的东方力量”。

截止目前,DeepSeek 在美区苹果 App Store 免费榜上力压此前霸榜的 ChatGPT排在了第一位。

我们在 DeepSeek 的官网可以看到,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。超赞的性能让外国人直接炸锅了。

DeepSeek与其他大模型的性能对比
而另一个让外国人炸锅的原因是 DeepSeek 的开发成本很低,模型训练只用了 550 万美元,相当于 Meta 高管一年的工资,而且还开源。
在使用成本上,DeepSeek 也是性价比拉满,例如 R1 模型,100 万 tokens 的输入,OpenAI 需要 55 块,而 DeepSeek 只要 1 块。100 万 tokens 的输出,OpenAI 需要 438 块,而 DeepSeek 只要 16 块。
DeepSeek-R1 API 价格
另外,在开源了 DeepSeek-R1-Zero、DeepSeek-R1 同时,他们基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏得到的六个密集模型(1.5B、7B、8B、14B、32B、70B),也全部开源。用户可以直接部署在自己的电脑上。其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
这下,全球 AI 爱好者和开发者都沸腾了,大家纷纷在社交平台上讨论这款模型。有人发帖说要跟 200 刀的 ChatGPT 彻底说再见。许多人开始转向这个性价比极高的选择。这也让一众小型公司和独立开发者看到了新的机会。
最近在匿名平台 Teamblind 上疯传的一条帖子中,一名 Meta 员工透露:“现在 Meta 内部已经进入了恐慌模式。工程师们正忙着抢时间,全面分析 DeepSeek 的模型,力求复制其所有可能的技术。”

看来科技巨头们的压力也在蹭蹭上涨!Sam Altman 更是放出了 GPT-o3 mini 要来的消息,被下面的网友称之为“DeepSeek 效应”。
Altman 是公认的营销鬼才,而 DeepSeek 团队则展现出了截然不同的低调风格。
创始人梁文峰在组建团队时,没有选择经验丰富的资深工程师,而是专注于招募清华、北大等高校的应届博士生。虽然这些年轻人缺乏行业经验,但他们充满好奇心和专注。梁文峰希望员工能自由使用计算资源,进行不拘一格的创新研究,这与硅谷那些依赖资深专家、注重快速商业化的大型 AI 公司形成鲜明对比。
没有聘请资深的 AI 专家,没有依赖顶级的 GPU,也没有投入巨额的运行成本,DeepSeek 依然能够取得优秀的成果。
毕竟,在传统的 AI 研发模式中,重金砸在硬件和专家团队上早已成为常态,而 DeepSeek 却用灵活的资源调配打破了这一常规。它不仅证明了 AI 的创新和效率并非只能通过“烧钱”来实现,还为整个行业带来了新的思考:或许,真正的技术突破并不一定依赖昂贵的资源,而是如何在有限的条件下做到极致的发挥。
 图书推荐 

《深度学习入门4:强化学习》

斋藤康毅 |著

郑明智 |译


深受读者喜爱的深度学习入门“鱼书”系列第四弹,深度学习入门经典,从零开始掌握强化学习。沿袭“鱼书”系列风格,提供实际代码,边实践边学习,无须依赖外部库,从零开始实现支撑强化学习的基础技术。


《深度强化学习》

王树森 黎彧君 张志华 | 著

系列视频课全网播放量 100 万+,涵盖最近 10 年最重要的深度强化学习方法,围绕实用、精简两大原则,专注核心知识,成书篇幅仅 312 页,超轻松入门 DRL!全彩印刷,原创 140 多幅精美全彩插图,上市一周登上京东新书销量排行榜第一,口碑、内容兼具。


《Python深度学习(第2版)》

[美] 弗朗索瓦·肖莱 | 著作
张亮 | 译


本书由深度学习框架 Keras 之父弗朗索瓦·肖莱执笔,通过直观的解释和丰富的示例帮助你构建深度学习知识体系。作者避免使用数学符号,转而采用 Python 代码来解释深度学习的核心思想,包括 Transformer 架构的原理和示例。


扫码啦!一起进群学习~👇



DeepSeek-R1 开源对学术研究的影响也很大,研究人员可以更方便地获取和分析模型的代码和数据,这有助于推动深度学习领域的研究进展,说不定能诞生更多新的算法和模型。

开源带来的一个直接好处就是能让更多人参与到模型的改进和优化中来,加速模型的迭代速度,也能促进技术的交流和共享。DeepSeek-R1 的开源或许能打破 OpenAI 等巨头对大模型领域的垄断。

我觉得 DeepSeek 的模式很难复制,它需要一个非常有远见的领导者,还要有一群有能力且愿意为理想奋斗的年轻人,这种团队氛围可不是随便就能复制的。

DeepSeek 的模式并非完全不可复制,但需要根据自身情况进行调整。例如,可以借鉴其注重人才培养和鼓励创新的理念,并在资源有限的情况下,尽可能提高资源利用效率。

挑战 OpenAI 的地位并不容易,OpenAI 的技术积累和生态系统都非常强大,DeepSeek-R1 还有很长的路要走。不过,DeepSeek 的出现至少给 OpenAI 带来了一些压力,促使它不断改进和创新。

DeepSeek 的成功也有一定的运气成分,它抓住了大模型发展的风口,而且它的技术路线也比较独特,这些因素很难完全复制。不过,DeepSeek 的低成本模式确实值得借鉴,特别是对于那些资源有限的创业公司来说。

我觉得 DeepSeek-R1 开源最大的影响就是降低了 AI 开发的门槛,让更多小型公司和个人开发者也能参与进来,搞不好能引发一波AI应用的创新潮。

DeepSeek-R1 的未来发展前景很光明,它有强大的技术实力和低成本优势,如果能持续改进模型性能,扩大用户群体,很有可能成为 OpenAI 的有力竞争者。

我觉得 DeepSeek-R1 的关键在于能否建立起自己的生态系统,包括开发者社区、应用场景等等。如果能吸引更多开发者和用户,它的未来发展前景将不可限量。

我觉得核心在于找到合适的团队,并且给予他们足够的信任和自由度。不过,想找到一群像DeepSeek团队一样既有实力又肯拼的年轻人,可不容易啊!

关于“DeepSeek-R1 的未来发展前景如何?它能否持续挑战 OpenAI 的地位?”这个问题,我觉得OpenAI也不是吃素的,竞争会很激烈,最终谁能胜出,还要看后续的发展。