国产大语言模型DeepSeek-R1爆火,超越ChatGPT登顶美区App Store榜首,性能强悍且成本低!
原文标题:DeepSeek爆火!反超ChatGPT,登顶美国苹果免费App榜首
原文作者:图灵编辑部
冷月清谈:
DeepSeek-R1 在后训练阶段大规模使用强化学习技术,使其在数学、代码、自然语言推理等任务上的性能比肩 OpenAI o1 正式版。值得注意的是,DeepSeek-R1 的模型训练成本仅为 550 万美元,并且已经开源。
在使用成本方面,DeepSeek-R1 也极具优势。与 OpenAI 相比,DeepSeek-R1 的输入和输出成本都大幅降低,例如100万 tokens 的输入,OpenAI 需要 55 元,而 DeepSeek 只要 1 元。
除了 DeepSeek-R1-Zero 和 DeepSeek-R1 之外,DeepSeek 还开源了六个基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏得到的密集模型(1.5B、7B、8B、14B、32B、70B),用户可以直接部署在自己的电脑上。其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
DeepSeek 的成功与其独特的研发模式密不可分。创始人梁文峰专注于招募高校应届博士生,鼓励员工自由使用计算资源进行创新研究,这与硅谷大型 AI 公司依赖资深专家、注重快速商业化的模式形成了鲜明对比。DeepSeek 的案例表明,在有限的条件下,通过灵活的资源调配和团队的创新精神,同样可以取得突破性的成果。
怜星夜思:
2、DeepSeek 的低成本研发模式是否可复制?
3、DeepSeek-R1 的未来发展前景如何?它能否持续挑战 OpenAI 的地位?
原文内容
继小红书风靡全球后,国产大语言模型 DeepSeek 又在全球范围内引起轰动。这个周末简直被 DeepSeek 刷屏了,距离去年底发布 DeepSeek—V3 模型还没过去多久,他们又推出了一款新的推理模型 DeepSeek—R1。直接引爆外网,不少网友称它为“神秘的东方力量”。
截止目前,DeepSeek 在美区苹果 App Store 免费榜上力压此前霸榜的 ChatGPT,排在了第一位。
我们在 DeepSeek 的官网可以看到,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。超赞的性能让外国人直接炸锅了。
《深度学习入门4:强化学习》
斋藤康毅 |著
郑明智 |译
深受读者喜爱的深度学习入门“鱼书”系列第四弹,深度学习入门经典,从零开始掌握强化学习。沿袭“鱼书”系列风格,提供实际代码,边实践边学习,无须依赖外部库,从零开始实现支撑强化学习的基础技术。
王树森 黎彧君 张志华 | 著
系列视频课全网播放量 100 万+,涵盖最近 10 年最重要的深度强化学习方法,围绕实用、精简两大原则,专注核心知识,成书篇幅仅 312 页,超轻松入门 DRL!全彩印刷,原创 140 多幅精美全彩插图,上市一周登上京东新书销量排行榜第一,口碑、内容兼具。
《Python深度学习(第2版)》
[美] 弗朗索瓦·肖莱 | 著作
张亮 | 译