Manus发布“Wide Research”:百个Agent并发,颠覆传统AI深度研究

Manus发布“Wide Research”:百AI并行,能否颠覆传统AI研究?

原文标题:Manus数月憋大招, 100个Agent并发只为选双鞋?肖弘放话:第一阶段就得先做超贵的AI!

原文作者:AI前线

冷月清谈:

中国人工智能初创公司Manus近日推出了名为“Wide Research”的突破性新功能。该功能的核心特点是,它与OpenAI等主流竞争对手的“深度研究”(单个AI Agent进行深度分析)路径不同,可通过部署多达数百个AI Agent并行处理大规模任务,旨在对传统AI研究方法构成挑战。每个子Agent都是功能完备的Manus实例,能够独立运行并承担任何通用任务,具备高度灵活性和可扩展性。例如,它能同时对比100款运动鞋,或生成50种不同视觉风格的海报设计,并能更快、更多样化地产出成果。

Manus的这项新功能基于其独特的个人云计算平台架构,经过数月优化,计算能力较初始版本提升了100倍。然而,文章也指出,Manus并未提供直接证据、性能基准或详细技术解释来证明这种并行模式比单个高性能Agent更高效,也未说明其在资源消耗、协调复杂性方面的取舍合理性。此前,类似的多Agent系统曾被用户反馈存在性能缓慢、令牌消耗高、执行透明度低等问题。

此举背景源于Manus在撤出中国市场后寻求产品差异化。作为一家曾备受关注、估值高达5.5亿美元的公司,Manus此次推出的“Wide Research”功能初期定价为每月199美元,价格相对较高。Manus联合创始人兼CEO肖弘对此表示,AI在开始时更像是“超贵但是拓展人类能力边界的AI产品”,未来将逐步用前期赚到的钱去制造更实惠的AI产品,并称目前正处于这一战略的第一阶段。其商业模式强调AI早期应服务于拓展人类能力的高价值领域。

怜星夜思:

1、关于Wide Research这种“广度优先”的多Agent并行模式,你认为它在哪些实际应用场景下会比传统的“深度研究”Agent更具优势?有没有可能也存在一些不适用的场景?
2、文章提到Manus没有提供足够的性能基准数据来证明其效率,你觉得对于AI产品来说,公开性能数据和技术细节真的那么重要吗?如果厂商选择不公开,可能出于哪些考量?
3、Manus CEO肖弘说AI“第一阶段就得先做超贵的AI”,这种高价策略对于早期市场和用户接受度会有什么影响?你认为这种商业模式在AI领域可行性有多大?

原文内容

整理 | 华卫

刚刚,中国人工智能初创公司 Manus 推出了一项名为“Wide Research”的新功能。在发布视频中,Manus 联合创始人兼首席科学家季逸峰(Yichao "Peak" Ji)亲自介绍并进行了使用演示,就像他当初首次推出 Manus 时那样。

据悉,这一突破性功能可让用户借助多个 AI Agent 来同时处理大规模任务,单次甚至可调用 100 多个 Agent,所有 Agent 都专注于完成某一单一任务(或一系列有助于实现上述总体目标的子任务),旨在对人工智能行业中传统的深度研究方法构成挑战。

最初,Wide Research 将向 Manus Pro 计划用户开放,定价为每月 199 美元。之后,该公司计划逐步向 Plus 和 Basic 计划的订阅用户开放这一功能。

走不同于“Deep Research”的路径

OpenAI、谷歌、xAI 等多家主要竞争对手推出的“深度研究”(Deep Research)或“深度研究员”(Deep Researcher)人工智能 Agent,能进行长达数分钟乃至数小时的广泛、深入的网络研究,并为用户撰写引用规范、内容详尽的报告。

与之不同的是,Manus 采取了另一种路径。Wide Research 非依赖单个 AI Agent 进行深度分析,而是可同时部署 100 多个 AI Agent,处理单个任务或一系列相关子任务。每个子 Agent 都是功能完备的 Manus 实例,能够承担任何一般性任务,不受预设角色限制。

在季逸峰的演示中,该系统轻松对比了 100 款运动鞋。为完成这项任务,Manus 的 Wide Research 几乎瞬间启动了 100 个并发子 Agent——每个子 Agent 被分配分析一款鞋的设计、价格和库存情况。几分钟内,系统就生成了可排序的矩阵,并以电子表格和网页两种格式呈现结果。

据介绍,Wide Research 不仅限于数据分析,还可用于设计探索等创意任务。在一个案例中,Manus 的多个 Agent 同时生成了 50 种不同视觉风格的海报设计,并将精修后的素材打包成可下载的 ZIP 文件返回。

Wide Research 的潜在优势似乎在于,让所有这些 Agent 并行运行速度更快,且能产出比研究报告更优质、更多样化的成果,这与其他 AI 提供商已展示或推出的单一 “Deep Research” Agent 形成对比。

借助 Wide Research,Manus 用户可以将研究或创意探索任务分配给数十甚至数百个子 Agent。但 Wide Research 的关键不仅仅在于拥有更多的智能体,而是它们如何协作。不同于那些角色预设的传统多 Agent 系统(例如设有经理、程序员或设计师等角色),Wide Research 中的每个子 Agent 都是功能完备、特性齐全的 Manus 实例——而非针对特定角色的专用 Agent,它们能够独立运行并承担任何一般性任务。

“这种通用性释放了灵活性:任务不受限于固定格式或预定义领域。”Manus 表示,这一架构决策为灵活、可扩展的任务处理打开了大门,使其不再受限于僵化的模板。从本质上讲,Wide Research 是一个系统级的并行处理机制,以及一个智能体到智能体协作的协议。

架构经数月优化,

计算能力扩展 100 倍

“Manus 从来不仅仅是一个 AI,它一直是一个独一无二的个人云计算平台。”据 Manus  称,每个 Manus 会话背后都运行着一个专用的基于云的虚拟机,允许用户编排复杂的云工作负载——只需与 Agent 对话即可。从生成定制的租赁演示到在安全沙箱中安全评估前沿开源项目,虚拟机的图灵完备性赋予了 Manus 其通用性,并为无限创意可能性打开了大门。

该公司认为,这种架构是实现真正通用人工智能工作流的关键。此次发布的 Wide Research,正是他们基于这一基础构建的第一个功能。

季逸峰在视频中解释道,Wide Research 是他们对虚拟化与 Agent 架构做了数月优化后的首个应用,其计算能力的扩展性较初始版本提升了 100 倍。并且,该功能设计为在需要大规模分析的任务中自动激活,无需手动切换或配置。

另外,此前有报道称,Manus 的平台是由 Anthropic 的 Claude 模型和阿里巴巴的通义千问(Qwen)模型提供支持的。

值得注意的是,尽管 Manus 宣称 Wide Research 是 Agent 并行技术的突破,却未提供直接证据,证明生成数十或数百个子 Agent 比让单个高性能 Agent 按顺序处理任务更高效。

其发布未包含性能基准、对比数据或技术解释,无法说明这种方式的取舍合理性,如资源消耗增加、协调复杂性提升或潜在的效率低下等问题。同时,关于子 Agent 如何协作、结果如何整合,以及该系统是否在速度、准确性或成本方面具备可衡量的优势,也缺乏具体细节。

此外,在更广泛的行业生态中,类似的子 Agent 方案效果参差不齐。使用同类系统的用户反馈了诸如性能缓慢、令牌消耗高、执行过程透明度低等问题。

因此,随着 AI 行业的持续演进,Wide Research 的成功可能会影响多 AgentAI 系统未来的发展方向。然而,其真正的影响力和有效性仍有待观察——毕竟该功能刚走出实验阶段,尚未得到广泛应用。

   撤出中国市场后,

欲以新功能求差异

不过,无论如何,Manus 推出 Wide Research,仍是 AI 研究工具发展中的大胆一步。通过让用户将任务分配给数十甚至数百个子 Agent,Manus 正在挑战 AI 辅助研究与创意探索的传统模式。

据外媒报道,有知情人士称,Manus 的技术团队在过去两个月里一直在研发这项新功能,希望借此让自家产品形成差异化优势。

今年早些时候,Manus 因面向普通消费者和“专业消费者”(即希望借助工具开展工作的专业人士)推出多 Agent 协同平台而备受关注,腾讯控股、高榕资本(前红杉中国)和真格基金等均为其早期投资者。

该公司在 3 月预览了其所谓的通用人工智能 Agent,这种 Agent 能够完成基于网络的任务,从筛选简历到根据基本指令创建旅行行程。之后,Manus 的热度爆涨,内测码一度被炒至 10 万元。次月,它获得了由美国风投公司 Benchmark 领投的 7500 万美元融资,为其带来 5.5 亿美元的估值,并促使字节跳动和 MiniMax 等多家公司纷纷开发自己的 AI Agent。6 月,Manus 又在其产品中增加了人工智能视频生成器。

然而,近期 Manus 突然将其业务大面积撤出中国市场。继 6 月份把总部从中国迁到新加坡、并在东京以及美国加利福尼亚州的圣马特奥设立办事处后,又被曝中国区团队的大幅优化动作。据悉,除 40 多名核心技术人员外,其余员工全部面临裁员优化,公司提供 N+3 或 2N 的赔偿方案。

目前,Manus 的产品暂不在中国市场提供,国内社交账号内容也全部清空。前不久,Manus 联合创始人张涛对此的回应是:由于他们使用的大模型(OpenAI、Claude)等不支持在中国地区运营,因此需要搬离中国。

此前,Manus 的服务就被吐槽“贵得离谱”,如今发布的 Wide Research 无论从功能运行情况还是订阅价格来看,显然会更加“烧钱”。

就此,Manus 联合创始人兼 CEO 肖弘在社交媒体写下这样一段话:

AI 在开始时更像边际成本很高的原子生意,然后 (也许会) 逐步转变成为边际成本更低或者接近于零的比特生意。


和这个匹配的做法是:

1. 制造超贵但是拓展人类能力边界的 AI 产品。

2. 用 1 挣到的钱造价格实惠的 AI 产品。

3. 再用 2 挣到的钱造价格更实惠的 AI 产品。


现在在阶段 1,也才刚刚开始。下一个发布,再来 100x Token 消耗量。

参考链接:

https://manus.im/zh-cn/blog/introducing-wide-research

https://theoutpost.ai/news-story/manus-unveils-wide-research-a-revolutionary-multi-agent-ai-platform-18503/

https://venturebeat.com/ai/youve-heard-of-ai-deep-research-tools-now-manus-is-launching-wide-research-that-spins-up-100-agents-to-scour-the-web-for-you/

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

InfoQ 老友!请留步!极客邦 1 号客服上线工作啦!

后续我将通过微信视频号,以视频的形式持续更新技术话题、未来发展趋势、创业经验、商业踩坑教训等精彩内容,和大家一同成长,开启知识交流之旅

欢迎扫码关注我的微信视频号~


今日荐文

图片

你也「在看」吗?👇

超贵的AI?那不就是给那些先富起来的人用的嘛!对我们普通用户来说,这价格门槛太高了,根本接触不到。虽然能理解高科技产品初期成本高,但如果AI一直这么“阳春白雪”,就怕它始终无法像互联网一样真正改变普罗大众的生活。不过,对于那些急需AI来优化业务流程、提升竞争力的企业大客户来说,只要能带来实实在在的回报,价格可能就不是第一考量了。

这就跟找工作一个道理,你说自己能力强,总得拿出项目经验、业绩数据来证明吧?AI产品也一样,性能数据就是它的“简历”。不公开,可能是因为“简历”不够漂亮,或者怕被“猎头”挖走核心技术。当然,也有可能是走“神秘主义”路线,先把概念抛出来,等市场反应再决定下一步。但这在日趋成熟的AI市场,没有数据支撑可能很难服众。

历史上很多颠覆性技术都是从高价、小众开始的,比如早期的计算机、智能手机。Manus的这种策略,可以理解为先瞄准生产力工具市场,让少数高价值用户承担高昂的研发和运营成本,打磨产品。一旦技术成熟、成本下降,再逐步推出面向大众的平价版本。这种“先富带后富”的商业模式在科技界并不少见,关键在于“超贵”的AI是否真的能提供“超值”的体验,让用户觉得物有所值。

对于需要快速处理大量同质化信息、进行初步筛选或多样化探索的场景,比如市场调研、海量数据分类、产品选型比较、创意发散等,多Agent并行确实能展现出惊人的效率优势。但如果任务要求深度逻辑推理、严谨的因果分析、或者需要对特定领域进行极其细致和精准的考证,比如撰写深度研究报告、法律文件分析或复杂的科学计算,单Agent的“深度研究”模式或许更胜一筹,因为并行Agent的协调和结果整合可能成为新的挑战。

肖弘的观点反映了一种高端市场先行策略。在AI发展早期,技术成本高昂,且初期用户多是追求效率提升和能力边界拓展的专业人士或企业,他们对价格的敏感度相对较低,更看重实际价值。高价策略有助于覆盖研发投入,支撑企业持续创新,并在高端市场树立品牌形象。这种模式在技术发展初期是可行的,特别是对于能真正解决行业痛点、创造巨大生产力价值的AI产品。但其影响在于限制了普惠性,可能导致初期用户群体较窄,需要后续逐步降低成本,才能实现市场普及。

从技术发展和行业透明度来看,公开性能数据和关键技术细节至关重要。这不仅是衡量产品优劣的客观标准,也是促进行业竞争和技术进步的动力。厂商若选择不公开,可能存在多种考量:一是产品仍处于早期阶段,数据不够理想,或存在明显短板,公开可能影响市场信心;二是出于商业竞争考虑,避免核心技术被竞争对手模仿或破解;三是可能策略性地选择先追求市场曝光和用户规模,而非立即聚焦于严谨的技术验证。但长期来看,缺乏透明度可能会影响用户的信任和产品的可信度。

广度优先啊,那肯定是购物狂的最佳搭档!买鞋子、选衣服、找民宿,让AI们帮我一次性对比所有款式、价格、评价,想想就爽。但要是让我写个八百字的领导发言稿,或者分析一下今年经济走势,一百个AI给我一百个答案,那我估计得疯。所以,轻松愉快的跑腿活适合,真正要动脑筋的活,可能还是差点意思。

说真的,我买东西都喜欢看参数、看测评,AI产品当然也一样啊!嘴上吹得再厉害,没有硬数据支撑,我心里总犯嘀咕。厂商不公开,要么是数据不好看,怕打脸;要么就是这技术还没完全跑通,还在“画饼”阶段;再或者,就是这核心技术是机密,生怕别人学去了。感觉有点像那种老说自己“效果好但不能说原理”的祖传秘方,总让人觉得不踏实。

打个比方,Wide Research就像是给你找了一百个“快手”小助手,能帮你瞬间把几百件衣服快速一眼看完并推荐几十件好看的。但如果你是要写篇诺贝尔奖级别的物理论文,你肯定不会找一百个小助手来每人写一行,你还是需要一个或者少数几个顶尖的科学家去深入研究。所以,跑量和快速筛选是强项,但深度分析和原创性理论探索可能就不是它最擅长的了,搞不好还会一堆“看似相关”的无效信息。