阿里云PAI现已支持一键部署DeepSeek-V3、R1等系列大模型,助力企业和开发者快速构建AI应用。
原文标题:阿里云PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
原文作者:阿里云开发者
冷月清谈:
DeepSeek-V3是一个671B参数的MoE大语言模型,采用MLA和DeepSeekMoE架构以实现高效推理和训练。DeepSeek-R1则是一个高性能推理模型,在推理能力上表现突出。此外,DeepSeek还提供了一系列基于开源模型蒸馏的小参数模型,方便用户根据自身需求选择。
通过阿里云PAI的Model Gallery,用户可以轻松访问、部署和使用这些模型。Model Gallery提供了从训练到部署再到推理的全流程支持,简化了模型开发流程,为开发者和企业用户提供了更便捷的AI开发和应用体验。
怜星夜思:
2、DeepSeek-R1 在后训练阶段使用了强化学习技术,具体是如何使用的?这种强化学习的应用对模型的推理能力带来了哪些具体的提升?
3、PAI Model Gallery 提供的一键部署功能是如何简化模型部署流程的?相比传统的模型部署方式有哪些优势?
原文内容
阿里妹导读
一、DeepSeek-V3、R1 系列模型
模型
|
基础模型
|
DeepSeek-R1-Distill-Qwen-1.5B
|
Qwen2.5-Math-1.5B
|
DeepSeek-R1-Distill-Qwen-7B
|
Qwen2.5-Math-7B
|
DeepSeek-R1-Distill-Llama-8B
|
Llama-3.1-8B
|
DeepSeek-R1-Distill-Qwen-14B
|
Qwen2.5-14B
|
DeepSeek-R1-Distill-Qwen-32B
|
Qwen2.5-32B
|
DeepSeek-R1-Distill-Llama-70B
|
Llama-3.3-70B-Instruct
|
二、PAI Model Gallery 简介
三、PAI Model Gallery 一键部署 Deep Seek-V3、Deep Seek-R
-
登录 PAI 控制台。
-
在顶部左上角根据实际情况选择地域。
-
在左侧导航栏选择工作空间列表,单击指定工作空间名称,进入对应工作空间内。
-
在左侧导航栏选择快速开始 > Model Gallery。