夸克发布「AI 超级框」,开启超级Agent时代

夸克发布「AI 超级框」,用户可在单个搜索框内完成复杂任务,标志着超级Agent时代来临。AI将思考、执行、互动并完成任务交付。

原文标题:超级Agent,鸣枪起跑

原文作者:机器之心

冷月清谈:

阿里旗下夸克APP发布全新「AI 超级框」,标志着超级 Agent 时代的到来。用户无需在多个应用间切换,仅通过一个搜索框即可完成复杂任务,例如:总结阅读材料、制定旅行计划等。夸克通过强大的推理模型和多模态技术,将各种工具和服务整合为智能模块,实现意图理解、任务规划和自主执行。与传统的AI Chatbot和垂直领域智能助手不同,夸克的超级 Agent 能够动态指导流程和工具的使用,深度理解用户需求并完成任务,将AI助手能力融入2亿用户的生活和工作。夸克坚持全自研路线,深度学习用户行为,从而更好地预测用户需求,通过AI完成任务交付,将过去人找信息转变为AI直接提供结果。

怜星夜思:

1、夸克「AI 超级框」的出现,是否意味着传统App的必要性正在降低?未来App会以什么样的形态存在?
2、文章提到夸克坚持全自研,这对于AI Agent的发展是必要的吗?自研和调用第三方API,哪种方式更有利于Agent的长期发展?
3、你认为「AI 超级框」这种All in one的模式,会成为未来AI应用的主流吗?它可能存在哪些潜在的风险和挑战?

原文内容

机器之心原创

作者:吴昕

一觉醒来,AI 应用变天了。

很多人每天还在搜索框里用手动挡的方式找信息,随着阿里 AI 旗舰应用夸克发布 AI 超级框,超级 Agent 时代呼啸而来,至少 2 亿人顷刻之间开上了具备 L4水平的电动汽车去执行各类复杂任务。

打开全新夸克,长相没有明显变化。


还是那个干净的界面、熟悉的框,带着一个深度思考按钮,几个常用工具服务入口在上、下依次排开。

但,此框已非彼框。

我把电子书拖到AI 超级框,要求给我写个阅读总结」。结果,虎躯一震。


夸克自动进入「 AI 总结,摘要、脑图、PPT 任务,随你指派。

配图不满意?可以 AI 生图替换;字体、内容不满意?直接改。


一套完整 PPT 唾手可得 ,直接存网盘就能转给同事。

从要求写总结到拿到 PPT,咱没出过 AI 超级框,看来这里头的灵魂可真变了。

回到主页。想知道宋太祖到底是怎么死的,学术上有哪些研究和说法,夸克跑了很多网页,给我做了一份整理。

点击接着问,他儿子下场如何?又接着问,史书对他是怎么评价的。

夸克没糊涂,知道前面问的是赵德芳等人,后面问的是史书如何评价赵匡胤,回答贼快!

接着,让夸克安排清明节假期行程、又接着问金秀贤最近塌房的八卦,问得很跳跃、但它每次都能精准接招。

点击图片查看细节内容

细思极恐啊。聊了三个话题,互不相干我还是没出过 AI 超级框!只用接着问」,根本不需要退出本次对话,开启新对话 ...... 

Manus 还得满世界调接口,而且速度慢到离谱,在全新夸克,都不用去外边折腾了,足不出框、一站搞定。

咱就说,超级 Agent 玩起来还能这么疯。

全新夸克:
一个 AI 超级框、一个超级 Agent

今年,AI Agent 的热度居高不下。在此之前,很多人对 AI Agent 的印象就是 AI Chatbot 。

他们都有一个神奇的通用界面,只有一个对话框,你可以和它唠嗑各种开放性话题,但也就是脑子和嘴皮子好使,真要办事儿可不行。

还有一些智能助手,比如某个理财助理、医疗助手、文生图助手、智能导购甚至 PPT 助手,它们能感知、会说还有点工具调用能力,可以办事,因为专注某个垂直领域,能力比较单一。

但真正的超级 Agent 具备三个核心特征:意图理解、任务规划、自主执行,并不拘泥于具体形式。当很多人执着于炫酷的对话演示、传统产品还在堆砌功能入口时,夸克彻底颠覆了产品架构——用阿里强大的推理模型和多模态打底,全由超级 Agent 来驱动服务、响应用户需求。

一句话,人家现在就是个超级 Agent。

具体来说,超级 Agent 会通过意图理解和自动化调度,将已有的丰富工具和服务转化为呼之则来、挥之则去的智能模块,可以弹性组合,自适应地满足用户在工作、学习和生活中的各种问题和任务。

也就是说,夸克会动态指导自己的流程和工具使用,控制任务完成方式,而不是依赖外部的工作流,不仅深度理解你的需求,还能深度执行完成它。

看吧,没有吸引眼球的炫技,仅靠一个 AI 超级框,夸克就将 Agent 助手能力实实在在地溶于 2 亿用户的生活、学习和工作中。

解剖夸克超级 Agent

所以,现在的夸克不再是一个生产力工具,而是一个集成了推理、多模态大模型的 AI 超级应用。

你也可以把它看做一个诸多 Agent 能力的总成,它们由一个神经中枢负责调度、协同,自主将用户需求转变为现实成果。

当你以各种方式、将千差万别的日常需求——无论是上传文档、截屏搜题、还是手动或者语音输入写个年终总结 PPT 制定日本 7 日游异地恋到底靠不靠谱——扔进 AI 超级框后,超级 Agent 的齿轮开始转动。

先有 Agent 理解你的需求。接着,中枢 Agent 会根据这些判断,对任务进行拆解、分配、思考、推理,决定任务的完成方式——交个单个 Agent 完成,还是需要几个 Agent 搭配搜索工具同时干活,它会安排好工作流程。

例如,给我来份总结,它可能会自动调用 AI 总结夜里咳嗽厉害睡不着,怎么办?,它可能会叫醒 AI 健康助手

如果你说要不要和男友继续异地恋,它可能启动深度思考,run 一波网站,给你一份中肯的建议。面对一道数学中考题,它会调出专属的AI 解题大师 。

最后,还有 Agent 负责结果的输出和呈现。

比如,合不合规、安不安全、用什么方式呈现最好(多模态还是单一文本、要不要表格),同时支持在夸克上编辑文档、转换格式、保存和分享。

举个例子:求出二次函数 y=(x−4)(x+2)y=(x−4)(x+2) 图像的对称轴。

这题难点在于如何将二次函数转换为对称轴公式对应的表达方法。在夸克返回的结果里,方法一详细给出了解题步骤和对应关系,方法二再次验证方法一的答案是对的,验证了结果,也拓展了用户思路。


一个超级框就够用了,自此告别 一个需求,N 个 App 的碎片化体验。

这是一次飞跃——从人找信息,变成直接得到一个结果,可以说这也是当下先进智能能力的最优产品形态。

讲到这里,好像也明白了为什么是夸克打响超级 Agent 第一枪。

五年前,夸克就给自己定位——要成为年轻人的全能助手。这些年积累了不少自研产品,环视四周,围绕 AI 搜索,提供回答、创作、总结、解题、信息存储等一体化服务的产品,似乎并不多见。

如今,再搭配自研新模型的强大能力,终于可以用一个极简的「 AI 超级框,去无限接近「 全能助手这一目标。

由此可见,当大模型规划任务和使用工具的能力变得更好、更强时,AI Agent 的落地速度可能会比很多人想象的要快,尤其是在数字世界、在一个 AI 超级应用身上。

值得一提的是,夸克对全自研的坚持,除了成就超级闭环,还有一点很重要——知道用户要什么,更好地预测用户行为。

例如,用户获得答案之后,往往会有一条支线导向后续动作,如修改、形成文案、做 PPT 、保存等,对这些历史行为的深度学习,也是夸克后续往 Agent 发展,自主帮助用户完成任务的基础。

当你凝视这个小小的AI 超级框时,看到的其实是通向未来信息获取方式的任意门。

阿里巴巴集团副总裁吴嘉说,过去是人在使用搜索,未来是 AI 在使用搜索。人类本身不再需要直接使用搜索等工具,而是把完整的任务指令直接给到 AI 。AI 会思考、执行,并在过程中互动调整,完成最终的任务交付。

这在不久的将来将全部实现,并诞生新的 AI 超级应用。

就像科幻作家 Gibson 说的:未来已经到来了,只是没有均匀分布而已。而作为 AI 时代的第一个超级应用,夸克迈出了宝贵的第一步。



© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

我觉得App的形态会发生变化,但不会消失。现在很多App都试图建立自己的生态,但用户并不买账,因为切换成本太高。夸克的「AI 超级框」其实是提供了一个更高效的入口,把多个App的功能整合在一起,但App本身还是存在的,只是用户的使用方式变了。未来可能App会更专注于提供原子能力,而AI Agent负责编排和调用这些能力。

全自研听起来很美好,但现实中很难做到所有环节都领先。我觉得更合理的策略是:在核心能力上坚持自研,比如模型和算法;在非核心的功能上,可以积极拥抱开源和第三方API。这样既能保证核心竞争力,又能快速迭代和优化产品。

All in one 听起来很诱人,但也很危险。一方面,它可能会导致功能臃肿,用户找不到自己需要的功能;另一方面,它可能会侵犯用户的隐私,因为所有数据都集中在一个地方。我觉得未来的AI应用应该是模块化的,用户可以根据自己的需求自由组合,而不是被强迫接受一个大而全的解决方案。

我觉得「AI 超级框」这种模式,本质上是一种流量整合。把各种服务都放在一个入口,可以提高用户粘性,降低获客成本。但是,如果这个入口不够智能,无法真正理解用户的需求,那就会适得其反。用户可能会觉得被过度打扰,反而选择离开。所以,关键在于如何做好意图理解和个性化推荐。

我觉得最大的风险是过度中心化。如果所有的服务都依赖于一个「AI 超级框」,那一旦这个框出现问题,整个生态都会受到影响。所以,应该鼓励更多的AI应用涌现,形成一个更加去中心化、多样化的AI生态。不能把鸡蛋放在一个篮子里。

长期来看,自研肯定更有利于Agent的发展。调用第三方API就像是租房子,短期内可以解决问题,但长期来看受制于人。只有掌握核心技术,才能真正实现Agent的自主性和可控性。当然,自研需要投入大量资源和时间,需要有长远的战略眼光。

与其说App必要性降低,不如说是对App提出了更高的要求。过去大家比拼的是功能数量,现在比拼的是能否被AI Agent高效调用。如果你的App无法提供清晰的API,无法被Agent理解和使用,那自然会被淘汰,所以我认为未来的App会更加模块化、标准化,以便更好地融入AI生态。

这取决于你的目标是什么。如果你想快速推出产品,抢占市场,那调用第三方API无疑是更快的选择。但如果你想打造一个具有独特竞争力的Agent,那自研是必不可少的。我觉得两者并不矛盾,可以先通过调用第三方API快速验证想法,然后再逐步替换为自研方案。

这个让我想起了小程序。小程序不也是想解决App臃肿的问题吗?但现在的小程序也越来越像App了。夸克的「AI 超级框」会不会也面临同样的问题?如果它集成的功能越来越多,会不会变得像一个大杂烩,反而失去了效率?我觉得关键在于如何保持它的简洁和智能,真正做到按需调用,而不是简单地堆砌功能。而且要小心步微信的后尘,自己做了裁判员又做了运动员。