阿里云面向海外发布 Qwen Cloud:主打 Agent、CLI 与一站式多模态模型接入

阿里云海外发布 Qwen Cloud,主打 Agent 调用、多模态模型接入与透明成本管理。

原文标题:阿里云海外重磅发布 Qwen Cloud

原文作者:阿里云开发者

冷月清谈:

阿里云在新加坡面向全球市场发布 Qwen Cloud,定位为面向 AI Agent 的云服务平台。其核心设计是三入口架构:Website 面向开发者探索和模型测试,Skills 将图像、视觉、视频等能力封装成 Agent 可理解的标准化指令,CLI 则服务于终端、脚本和 CI/CD 等自动化工作流。平台提供一站式模型接入体验,覆盖文本、视觉、图像、视频、音频、嵌入六大模态,并支持 Qwen 系列及第三方模型。开发者可使用统一 API Key 完成多模态任务,并在不同模型间切换和对比。企业侧,Qwen Cloud 强调透明账单、按维度成本分析、Token Plan 多模态订阅、团队共享、权限管理、速率限制等能力,试图降低 AI 应用从实验到生产过程中的集成和成本管理复杂度。

怜星夜思:

1、Qwen Cloud 把 Skills 作为 Agent 调用云能力的入口,这种方式会不会比传统 API 更适合未来的 AI 应用开发?
2、一站式接入文本、图像、视频、音频和向量模型,对开发者是便利,还是会带来更强的平台绑定?
3、Qwen Cloud 强调透明账单和 Token Plan,多模态 AI 应用的成本真的能靠订阅模式变得可控吗?
4、Qwen Cloud 同时接入 Qwen 和第三方模型,开发者在选模型时应该优先看价格、效果,还是生态兼容性?

原文内容

5月26日,阿里云在新加坡面向全球市场正式发布 Qwen Cloud(qwencloud.com)。阿里云首席技术官、国际业务总裁李飞飞表示:“海外市场对 AI 的需求持续旺盛,尤其是 Agent(智能体)的爆发让模型调用量和云资源消耗呈指数级增长”。当 Agent 成为云服务的重要用户,围绕人类设计的界面和交互逻辑都需要被重写。Qwen Cloud,正是为AI Agent 而生的全新服务方式。

专为Agent而生:Skills 与 CLI 重塑交互

云的主要消费者正在从“人”变成"Agent"。当智能体成为云服务的重要用户,传统的界面已无法满足需求。Qwen Cloud 创新性地设计了三入口架构,将平台能力转化为不同角色可直接调用的语言:

Skills(服务于 Agent):“这是 Qwen Cloud 的核心差异化所在。我们将图像生成、视觉识别、视频处理等复杂能力,封装为 Agent 可读的标准化指令(Skills Prompt)。”QwenCloud 负责人孔琳琳表示。以前,开发者需查找接口、编写调用代码、测试调试,再“教”给智能体。现在,只需向智能体下达一条自然语言指令,它即可自主理解并直接调用平台能力。无需编写底层代码,Agent 即学即用。

CLI(服务于工作流):为终端、脚本及 CI/CD 流水线提供高速、确定且可复现的命令行操作层。无论是自动化部署还是批量任务处理,CLI 确保了流程的稳定执行,让工作流不再受图形界面波动的影响。

Website(服务于人):专为开发者打造的探索门户。可免费起步,支持几百种模型并排对比、在线体验,一键获取 API 密钥。从实验到生产,仅需一个浏览器标签页。

网站服务于人类探索,Skills 服务于智能体思考,CLI 服务于工作流执行。三扇大门,通向同一个零摩擦平台。

一站式模型接入体验,六大模态全域覆盖

此外,Qwen Cloud 打破了传统多平台碎片化困境,打造真正的“一站式”模型接入体验。其 Web 入口不仅是模型列表,更是一条从免费探索、并排对比、在线测试到一键获取 API 的完整选用链路,让开发者无需绑定信用卡即可在单标签页内完成从实验到生产的闭环。

大多数 AI 平台始于文本也止于文本,但真实的应用场景远不止于此。Qwen Cloud 汇聚了阿里全系列模型并且引入三方生态模型,涵盖文本、视觉、图像、视频、音频、嵌入(向量搜索)六大模态。

无论是文档分析、截图理解,还是语音交互、视频摘要,开发者只需一个api key、一次集成,即可在一个平台上完成所有多模态任务。随着应用的发展,平台也能同步扩展,无需迁移。

透明账单与灵活计费,成本清晰可控

对于企业而言,AI 落地的最大痛点之一是成本不可控。Qwen Cloud 带来了透明、可预测的成本管理方案:支持按 API Key ID、Workspace ID、模型名称、输入/输出类型、调用渠道 等多维度分析。管理者可以清晰地知道:谁在用?用在哪?用了多少?成本来自哪里?

在计费模式上,Qwen Cloud 推出了创新的 Token Plan 多模态订阅服务:

  • 成本可预测:提供固定月费,涵盖文本、图像及语音功能,解决按量付费带来的预算波动难题。

  • 团队共享:支持多席位共享,方便团队协作统一管理。

  • 灵活超额:即使超出配额,服务也不会中断,超额部分自动转为按量付费,兼顾稳定性与灵活性。

此外,平台内置了企业级功能,包括工作区隔离、细粒度权限管理、速率限制、API 密钥管理及透明账单,确保从单人开发到大规模生产环境的平滑过渡。

开放多元生态,模型选择便捷高效

Qwen Cloud 坚持开放策略,除了完整的 Qwen 模型家族外,平台已接入业界顶尖的第三方模型,如专为高性能推理打造的 DeepSeek,未来还将有更多优秀模型加入。开发者可以在不更改任何集成代码的前提下,自由切换不同模型,并直观对比其成本与性能表现,真正掌握模型选择权。

另外,QwenCloud 已向全球开发者发出邀请,启动黑客松活动,鼓励大家在其上构建生产级 AI 智能体。

“三件事。就在现在,第一步:访问qwencloud.com,无需配置,5分钟即可试用模型。第二部:为您的 Agent 接入 Skills 提示词与 CLI,一条指令打通全平台能力。第三步:获取兼容 OpenAI 标准的 API 密钥,无缝对接现有工具链。即可解锁将强大模型转化为生产力的最快路径”孔琳琳表示。

如果是个人开发者或者黑客松,我建议先看价格和上手速度。能免费试、能快速拿 API Key、文档别太阴间,这些比“理论最优模型”更现实。灵感来了先做出来,别把时间都花在选型表格上。

3 个赞

回答“Skills 和传统 API 谁更适合未来”——未来可能是两者共存。人类开发者用 API 控制确定性,Agent 用 Skills 提升自主性。一个像方向盘,一个像自动驾驶辅助,谁也别急着把谁淘汰。

3 个赞

我觉得这事有点像以前低代码刚出来的时候:演示很惊艳,复杂场景还是要回到代码。Skills 对 Agent 很友好,适合快速拼装能力,比如识图、生成图、视频摘要这些。但真到金融、医疗、合规场景,估计还是得 API、日志、权限一套全上。

1 个赞

针对“选模型优先看什么”,我的排序是:先看任务效果,再看稳定性和成本,最后看生态。模型便宜但答不准,后面人工兜底成本更高;效果很好但延迟太高,也不适合在线产品。最好用自己的业务数据做评测,别只看官方榜单。

2 个赞

关于“Token Plan 能不能让成本可控”,我觉得只能解决一部分问题。固定月费能让预算更稳定,适合调用量相对可预估的团队。但多模态应用的成本波动很大,尤其是视频、语音、图像生成,一旦用户行为不可控,超额按量部分还是可能飙起来。

2 个赞