昆仑万维发布天工超级智能体:你的电脑正在自动打工,Office三件套或被颠覆?

昆仑万维发布天工超级智能体,集成多种AI能力,覆盖Office办公、内容创作等场景。开源框架,低成本使用,或将革新办公方式。

原文标题:惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

原文作者:机器之心

冷月清谈:

昆仑万维发布天工超级智能体(Skywork),该智能体集成了5个专家级AI Agent和1个通用AI Agent,能够一键生成专业文档、数据表格、PPT、播客、网页等多种内容,并支持音乐、MV、宣传片、绘本、有声书等多模态内容的输出。Skywork在多个AI Agent基准测试中表现出色,尤其在GAIA和SimpleQA测试中超越了其他竞争对手。此外,昆仑万维还开源了deep research agent框架,并开放了三大MCP接口,旨在构建以智能体为核心的“AI操作系统”。Skywork的特点包括场景全、能力强和框架开源,并且上线即可用,单个通用任务成本仅需0.96元。实测表明,Skywork在多场景写作、可视化数据分析、PPT制作、创意网页生成、智能音频播客以及音乐和视频生成等方面表现出色,具备任务协同、多模态生成、结果可信度和个人知识库等差异化实力。它通过自研的deep research模型、agent workflow框架和生成物模型,以及在线编辑系统和“化整为零”的任务处理方式,实现了从信息发现到结构化内容输出的全链路流程。Skywork的推出标志着AI智能体从技术展示向场景落地、从工具层向系统层的过渡,有望成为Office的下一次革命。

怜星夜思:

1、Skywork 这种“全能型”AI 智能体,和其他专注特定领域的 AI 工具相比,你觉得哪种更有发展前景?为什么?
2、文章提到 Skywork 具备个人知识库功能,可以形成“素材 - 创作 - 再积累”的正向循环。你认为这种个人知识库对内容创作者来说,最大的价值是什么?除了文章中提到的,还有哪些潜在的应用场景?
3、文章提到 Skywork 试图解决大模型“胡说八道”的问题,通过信源追溯来提高内容的可信度。你认为这种方式真的有效吗?还有哪些方法可以提高 AI 生成内容的可靠性?

原文内容

机器之心原创

编辑:杜伟

国产智能体,这次真封神了。


过去这段时间,「智能体」简直杀疯了。


无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。


作为人工智能的一种高级实现,智能体比大模型更具实体化、自主性、交互性,已经进化成「会思考、动手强、能串联一切工具的全能战士」。


就在 5 月 22 日,这条 AI 赛道迎来了一个足以傲视群雄的「巨无霸」产品,其背后站着的正是一家国产大模型厂商 —— 昆仑万维。


这家位居国内大模型第一梯队的选手,面向全球正式发布了天工超级智能体(Skywork Super Agents)(下文简称 Skywork),直接卷出了新高度!



与 Manus、OpenAI deep research、Genspark 等其他智能体相比,Skywork 有三大必杀技:「场景全、能力强与框架开源。


首先是「全」,Skywork 远不是一两个小工具拼凑出来的智能体,而是系统打包了 5 个专家级 AI Agent,可以一键生成专业文档、数据表格、PPT、播客、网页五件套,称得上是内容创作者眼中的黄金搭子。


更炸裂的是,Skywork 还提供了 1 个通用 AI Agent,可以一站式地输出音乐、MV、宣传片、绘本、有声书等多模态内容。


图片


其次是「智商」爆表,跑分成绩给了我们很大惊喜。


Skywork 在多个 AI Agent 基准测试榜单中登顶,比如在 GAIA(最困难、最全面的智能体基准测试)中,面对从初级到高级、从易到难的不同任务(Level 1 到 Level 3),它全面超越了 Manus、OpenAI deep research。



这还没完,Skywork 在 SimpleQA(评测智能体回答事实性问题准确性的基准测试)中的得分(94.5)同样超越了 OpenAI 以及当前 SOTA,解决大模型「胡言乱语」更给力了。



最后是让开发者沸腾的 —— 全球首个开源的 deep research agent 框架,这意味着每个人都可以参与到智能体的定义中来了。


同时,直接开放三大 MCP 接口,供开发者调用文档生成、数据分析、PPT 演示文档三大能力,形成以智能体为核心的「AI 操作系统」,成为开发者们的新基建。


  • 框架开源地址:https://github.com/SkyworkAI/DeepResearchAgent

  • MCP 地址:https://mcp.so/server/skywork-super-agents/Skywork-ai


还有一点特别值得称道,Skywork 不搞现在 AI 圈讨厌的饥饿营销那套,不排队、不抢码、不内测申请,上线即可用。性价比还贼高,单个通用任务成本仅需 0.96 元。


今日,昆仑万维重磅宣布天工超级智能体(Skywork Super Agents)APP 正式上线,这也是全球首款基于 AI Agent 架构的 Office 智能体手机 App。


看起来,想要体验智能体的小伙伴终于有了一个实力更强、价格又便宜的选择。



第一手实测:智能体界的「全能型选手」


从 OpenAI 的 deep research 到 Manus、Genspark 等专精型 Agent,市面上的产品在功能上可以说大同小异,而「谁真正能落地、谁真正好用」成为普通用户最关心的问题。


接下来,我们就搞个一手实测,看看 Skywork 这个「新秀」的实力究竟如何。



  • 全球官网:https://skywork.ai

  • 中国官网:https://tiangong.cn


多场景写作


最近 AI 率检测的问题频频登上各大平台的热搜榜。有大学生发帖称,熬秃了头写的毕业论文 AI 率被判了 80%,测试一番后发现朱自清的《荷塘月色》AI 率竟超 60%。为了去 AI 味儿,学生们绞尽脑汁,要么疯狂改标点,要么短句改长句……


对此,我们让 Skywork 生成一份适用于 B 站 3 分钟科技短视频的脚本, 吐槽一下当前 AI 技术的发展带来的魔幻现实。



不得不说,Skywork 设计的「UP 主台词」很有 B 站特色,如「屏幕前的各位『肝帝们』」、「亿点点变化」、「以前是怕抄袭,现在是怕被 AI」 等语句非常贴合年轻受众,既有梗又有深度。而且它还在合适的位置穿插着柱状图、专家观点的引用,更增强了脚本的传达力与可信度。


可视化数据分析


Skywork 的表格模式类似于 Microsoft Excel 和 Google Sheets,输入主题、需求或者上传原始数据后,它就能智能分析并生成表格、图标等。


我们输入指令:「生成一份图灵奖 2015-2024 年的获奖统计」。


Skywork 并不急于执行,而是通过与用户交互确认任务细节,包括统计维度(如获奖人数、国籍、研究领域、所属机构)和展示方式(如表格、趋势图、占比图等)。这种前置的任务拆解能力,使得整个分析过程具有极高的准确性和可控性。


紧接着,它会自动生成待办清单,调用各种 MCP 工具依次执行任务,整个过程无需用户参与。


图片


Skywork 准确完成了数据整理和分析任务,最终生成四个结构完整、信息翔实的 sheet。在可视化呈现方面,它生成的饼图、柱状图和折线图不仅美观,还极具数据表达力。



精美 PPT


打工人最怕三件事:加班没有加班费、老板突然 @你、顺便做个 PPT。别的顺便是顺手,这个「顺便」是要命:字体怎么调都不对,图表怎么看都很土,辛辛苦苦熬夜干到凌晨三点,结果老板瞅了一眼:「感觉不太对,你再打磨下」。


现在,Skywork 给每个被 PPT 逼疯的打工人开了张救命的「药方」。只要一句简单的 Prompt:制作《日本镰仓的旅游攻略》PPT,它立马就能生成一份结构清晰、颜值在线的 PPT。


[ 上下滑动查看更多 ]


从最终生成效果来看,该 PPT 不仅有实用信息点,还配了高质量的场景图、路线图和日程表,我们完全可以直接拿来用。


创意网页


今年 2 月份,Andrej Karpathy 提出了 Vibe Coding(氛围编程)的概念,码农们不用逐行写代码,只要用自然语言描述目标功能,专用大模型即可生成对应代码。


Skywork 目前也能实现这一功能,输入需求就能快速生成可溯源、可编辑、可应用的高质量多模态 html 成果。举个例子,我们让它「生成一个开心消消乐的网页小游戏」,几分钟后它啪地甩来一个水果卡通风的成品。


图片


这个网页小游戏不仅界面设计的好看,更重要的是,它真实可玩。在规定的一分钟内,玩家让三个或以上相同的水果图标连成一条直线即可消除,并且它还能根据得分情况增加等级。


智能音频播客


去年谷歌 NotebookLM 曾掀起一股 AI 播客热潮,仅需一个链接或文档,几分钟就能转成接地气的男女对谈。当时,不少 AI 圈的大咖为它「站台」,甚至连「死对头」OpenAI CEO Altman 都认为它很酷。



Skywork 这次上线的播客模式与之有异曲同工之妙。我们输入 Prompt:《面纱》读书对谈播客,它随即就去找资料写稿「录制」,然后一键生成音频播客。



AI 男女主播吐字清晰,语音语调自然真实,语气词、说话的气口都把握得相当到位。从内容来看,他俩也不是照本宣科,而是在真正读懂了小说后,针对播客这一媒介形式进行的自我创作。



与谷歌 NotebookLM 不同的是,如果我们对成品有任何调整需求,可以直接在聊天框里提,Skywork 随时修改。比如,我们让播客增加一部分,介绍小说中的男主沃尔特・费恩是个怎样的人,Skywork 立马在原有播客基础上更新了相应的内容。



音乐与视频生成


此前,昆仑万维发布了全球首个音乐推理大模型 ,不输 Suno 的惊艳效果让所有人看到了其在音乐生成领域的深厚造诣。


Skywork 的音乐实力同样不俗,比如「生成一段适合清晨独自散步时听的轻音乐」,它以钢琴为主旋律,整体节奏舒缓匀称,给人一种在晨光中漫步的惬意感觉。



视频生成也不在话下,比如「城市天台夜晚,一群会发光的小鸟从霓虹灯上起飞,汇聚成一个漂浮的时间钟表」,这种复杂 Prompt 的目标场景都能 hold 住,你就说赞不赞吧?!



Skywork 还能生成带背景音乐的视频,如下「generate a video with music: a man raps to the camera」。下一步的升级方向可能就是直接生成指定对白、语气的音画同步视频了,就像谷歌 Veo 3 所能做到的那样。



这一波实测下来,我们切身的感受是:强,太强了!


无论是生成内容的丰富性、专业性、准确性,还是界面设计的美观程度和布局的合理性,Skywork 都展现出了一个「全能型」智能体该有的样子,甩开了现有竞品。


人无我有,打造差异化竞争优势


在体验过程中,我们发现,Skywork 在任务协同、多模态生成、结果可信度和个人知识库上,具备了真正的「差异化实力」,克服了 Manus、OpenAI deep research 等竞品的痛点,实现了「人无我有」的后发优势。


超能 Office 三件套 —— 高效内容创作与生产力输出


当代打工人,谁没被文档、表格和 PPT 这工作「三件套」逼疯过?


如今,Skywork 把文档、表格、PPT 这三大办公工具整合在了一起,生成的内容不仅更详细、更条理,还能做出各种清晰好看的图表,甚至还能插入 Youtube 视频。


[ 上下滑动查看更多 ]


当然,如果你想对生成的内容进一步细化调整,Skywork 提供了在线编辑功能,通过「编辑」按钮直接在界面上修改文字、调整结构,像使用在线协作工具一样自然流畅。



导出格式也非常灵活,包括 PPTX、PDF、HTML、Google Slides 等多种格式,满足我们在决策讨论、版本迭代、二次创作中的不同需求。



生成酷炫内容 —— 多模态内容融合


在日常创作中,我们往往需要在文字、图片、音频、视频等多个工具之间来回切换,才能把一个想法完整呈现。


Skywork 在通用对话任务上打破传统 Agent 任务执行的边界,接入网页搜索、思考分析、图片生成、图片理解、语音生成、音乐生成、视频生成等十余个 MCP,让创作者无需奔波于不同平台,就能一键生成宣传片、MV、有声书、绘本等多种形式的内容。


比如我们仅用一个 Prompt,就让它混搭出一个小猫的旅行 vlog,不仅准确生成出各大地标,还让小猫在每一个场景中自然入镜,整个过程无需人工干预。


提示词:帮我生成一个小猫的旅行 vlog,内容分别是小猫到法国埃菲尔铁塔、美国自由女神像、中国长城、澳大利亚悉尼歌剧院、埃及金字塔、印度泰姬陵、日本富士山等地旅游并与这些著名景点自拍合照,配乐轻松欢快。


这种「Agent+MCP 多工具融合」的架构,有望引领下一代内容生产的范式革命。


信源可追溯 —— 向可验证内容创作演进


在如今这个内容泛滥的时代,信息可靠性反倒成了稀缺资源。大模型虽然擅长高效生成,但它们一本正经地胡说八道早就不是什么新闻。


Skywork 试图解决的正是这个痛点。它生成的每一段文字、每一张图片都不是凭空捏造,而是能清晰追溯到具体出处。输出文本可以关联原文段落,图片也能标注出溯源网页或知识库来源,甚至还附上完整的信源列表。



这种将信息溯源融入创作流程,让用户在生成内容的同时随时验证,大大降低了大模型「满嘴跑火车」的风险,真正让每一次产出都有据可查。


个人知识库 —— 打造私有化智能内容循环


如今,市面上的智能体普遍存在的一大痛点在于:素材零散、成果不可持续,缺乏系统性积累机制。


为了解决这些挑战,Skywork 上线了个人知识库。我们可以上传 pdf、doc、ppt、xls 等多种格式的文件,也可以上传录音、url 和 youtube 视频播放地址。每个知识库支持上传最多 50 个文档,并可根据不同主题创建多个知识库,实现清晰有序的知识管理。


更重要的是,Skywork 不只是一个信息存储工具,更是一个智能创作引擎。基于知识库内容,我们可以一键生成 多模态内容,它们又能反向存入知识库,形成「素材 - 创作 - 再积累」的正向循环,打造真正可生长的个人知识系统。



以上这些差异化功能,构成了 Skywork 的核心竞争力,使之成为真正「有用、敢用、好用」且更具性价比的 AI 智能打工人。


从信息发现到结构化内容输出

全链路流程被打通


为了实现通用化、性能更强的智能体,Skywork 在底层技术上祭出了多项自研,打造全链路智能内容引擎,从深度搜索到高效生成,一站式解决复杂任务。


首先自研一个 deep research 模型,通过依托「深度思考 + 推理」的信息检索,不仅查得更广与更准,还能更快找到高质量源信息;强化学习能力的加持又进一步增强模型面向各种搜索任务的泛化性,性能上全面对标 OpenAI 竞品。


接下来是一套自研的 agent workflow 框架,在高效完成传递信息、拆解任务之外,还能灵活调用基座大模型,使智能体能力得以延伸。效果也非常显著,在开源的 deep research 排行榜上拿下了 SOTA 成绩。


此外还自研一个生成物模型,实现高质量数据的生成、收集和训练,使生成内容更丰富、更真实且可读性更强;配合自研的在线编辑系统,无缝兼容常见办公软件,实现一站式内容生成与修改,并能一键导出成稿,效率与友好性绝对是拉满了。


最后,面对特别复杂的任务也有诀窍 —— 「化整为零、各个击破」,即将复杂任务拆分为多个小任务,每个小任务单独进行深度研究、互不干扰,有效突破了模型上下文长度的限制,支持超复杂任务协同解决。


正是技术上的一系列突破,Skywork 才有了如今敢于叫板一切对手的实力。


Office 的下一次革命来了?


自大模型技术爆发以来,人们一直在寻找应用的突破方向,最先开启自动化革命的恰恰是写代码本身。


现在,很多人都知道自然语言驱动的编程工具 Cursor,它正在吸引越来越多的程序员。人们写代码的方式已经发生了变化:先让 AI 写一个 readme 列出项目设计思路、功能逻辑,然后再让 AI 一步一步地实现就可以了。


图片


Cursor 也让编程门槛降到了一个前所未有的低点,号称让非程序员也能参与开发。只要你能描述清楚需求,Cursor 就能帮你生成专业级的代码。


同样地,超级智能体带来的能力,就像是 Office 版本的 Cursor。无论是制作文档、表格、PPT,还是生成网页或播客,它都可以根据你提出的需求快速进行生成,节省你大量的工作时间。


随着智能体成为 AI 产业界的核心关键词,它已过了秀概念的阶段,并开始了从技术展示向场景落地、从工具层向系统层的过渡。此次,Skywork 的推出不仅印证了中国 AI 企业在智能体领域具备了与国际对手抗衡乃至超越的实力,而且预示了接下来在该 AI 方向上「技术 + 场景 + 生态」全面交锋的趋势。


对于昆仑万维来说,这是一次具有战略意义的突破。在未来更大的应用前景铺开之前,它用一款全栈自研的超级智能体为自己在市场上赢得了先机。从上手体验来看,这款产品已经越过了实用化的门槛。


或许过不了多久,大量的工作就会由智能体接手,这何尝不是办公全家桶的一次进化?你只需要提出需求,投喂文件资料,确认好细节后,坐等 AI 交作业!

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

我觉得个人知识库最大的价值是实现了知识的“活化”。以前我们收集的资料,往往是静态的、孤立的,难以充分利用。而 Skywork 的个人知识库,可以将这些资料与 AI 能力结合起来,让它们“活”起来,成为创作的源泉。比如,我可以上传自己写的文章,让 Skywork 分析我的写作风格,然后帮我生成类似风格的新内容。

个人知识库未来的应用场景非常广泛,比如:

* 智能客服:基于产品知识库,自动回答用户提问,提高客服效率。
* 智能投顾:基于金融知识库,为用户提供个性化的投资建议。
* 辅助医疗:基于医学知识库,辅助医生进行疾病诊断和治疗。

仅靠信源追溯是不够的,但这是一个重要的进步方向。信源追溯能让用户知道 AI 生成的内容来自哪里,方便用户自行判断信息的可靠性。但如果信源本身就存在问题,或者 AI 对信源的理解有偏差,仍然可能导致错误信息的产生。

以下是一些可以提高 AI 生成内容可靠性的方法:

* 使用高质量的训练数据:确保训练数据来源可靠、准确,并进行清洗和筛选。
* 引入知识图谱:将知识图谱融入 AI 模型,让 AI 具备一定的常识和逻辑推理能力。
* 采用多模型融合:使用多个 AI 模型生成内容,然后进行对比和验证,提高准确性。
* 人工审核:对 AI 生成的内容进行人工审核,纠正错误,确保质量。

我个人更看好全能型。现在是快节奏时代,效率至上,谁能更快更好地解决问题,谁就能胜出。Skywork 这种集多种功能于一身的智能体,能省去用户在不同工具之间切换的时间和精力,提高工作效率。而且,全能型智能体更容易与其他应用和服务集成,形成更大的生态系统,想象空间更大。

从商业角度来看,全能型智能体更容易吸引更广泛的用户群体,这意味着更大的市场潜力。但专精型工具如果能在某个垂直领域做到绝对领先,建立起强大的壁垒,也能获得一席之地。这就好比电商平台和垂直电商的区别,前者靠规模取胜,后者靠专业性吸引特定用户。

谢邀,怒答一发!个人知识库这种东西,对于我这种重度知识焦虑症患者来说,简直是福音!之前我都是各种云笔记、网盘乱存一气,想找的时候大海捞针。有了这玩意,终于可以把我的知识碎片整理成体系了!

话说回来,我觉得它最大的价值是降低了“知识遗忘率”。以前学的东西,过段时间就忘得差不多了。现在可以把知识点整理到知识库里,随时复习巩固,妈妈再也不用担心我的学习了!

脑洞大开一下,以后是不是可以把自己的“人生经验”也整理到知识库里,等以后老了,可以给自己的 AI 子孙当传家宝?

这个问题问得好!AI 的“胡说八道”问题,本质上是 AI 缺乏“常识”和“价值观”。它只是在学习数据中的模式,并不真正理解内容的含义。所以,即使它能追溯到信源,也无法保证内容的可靠性。

要提高 AI 生成内容的可靠性,我觉得需要:

1. 给 AI 注入“常识”:构建大规模的常识知识库,让 AI 具备基本的常识认知。
2. 引导 AI 形成正确的“价值观”:通过奖励和惩罚机制,引导 AI 生成符合人类价值观的内容。
3. 让人类参与到 AI 的训练过程中:让人类专家对 AI 生成的内容进行评估和反馈,帮助 AI 不断改进。

我觉得信源追溯是“亡羊补牢”的做法,重点还是要在“防患于未然”。要从根本上解决 AI “胡说八道”的问题,需要提高 AI 的理解能力和推理能力。这就像教小孩一样,不能只告诉他答案,还要教他思考的方法。

具体来说,可以尝试以下方法:

* 开发可解释性 AI:让 AI 能够解释自己的推理过程,方便用户理解和纠正错误。
* 引入因果推理:让 AI 能够理解事物之间的因果关系,避免得出错误的结论。
* 进行对抗训练:让 AI 学习识别和抵御虚假信息,提高鲁棒性。

这个问题很有意思!我觉得吧,这两种方向都有各自的优势和适用场景。全能型选手就像瑞士军刀,啥都能干一点,适合快速解决各种零碎问题,满足多样化需求;而专精型选手就像手术刀,在特定领域能做到极致,解决高难度、专业性强的问题。长期来看,我觉得可能全能型会更受欢迎,毕竟大多数人的需求都是比较综合的,不太可能为了每个小问题都去找一个专门的工具。当然,如果某个领域特别重要,专精型的工具还是有它的价值的。

个人知识库最大的价值在于构建了一个属于自己的“AI 智囊团”。它不仅能存储和管理素材,还能将这些素材转化为可复用的知识,赋能创作。相当于你拥有了一个可以随时调用的“灵感库”和“素材库”,大大提升创作效率和质量。

除了内容创作,个人知识库还可以应用于:

* 个人学习:整理学习笔记、文献资料,形成自己的知识体系,辅助深度学习。
* 项目管理:记录项目进展、经验教训,形成项目知识库,提高团队协作效率。
* 职业发展:收集行业信息、技能知识,打造个人品牌,提升职业竞争力。