前百度AI高管All in Agent:Genspark Super Agent挑战传统搜索

前百度AI高管团队All in AI Agent:Genspark Super Agent挑战传统搜索,可自主完成复杂任务,灵活应变,效率更高。

原文标题:击败 Manus?前百度 AI 高管创业1年多,放弃500 万用户搜索产品,转推“最强 Agent ”,自述 9 个月研发历程

原文作者:AI前线

冷月清谈:

前百度AI高管景鲲和朱凯华创立的MainFunc公司,推出Genspark Super Agent,旨在通过自主思考、计划、行动和使用工具,帮助用户处理日常任务。该Agent采用混合代理设计,集成了多个大型语言模型和工具,能够灵活地处理跨领域的复杂任务。MainFunc曾推出AI Agent引擎Genspark,积累了500万用户,但团队认为传统AI搜索存在局限性,转而All in Super Agent。Super Agent能够根据问题灵活调整工作流程,利用多种工具和子智能体,并根据用户需求定制输出结果。通过减少控制、增加工具,Genspark Super Agent在基准测试中表现出色,但在数据隐私和系统透明性方面仍面临挑战。

怜星夜思:

1、Genspark Super Agent 提出的“减少控制、增加工具”的理念,对我们开发其他类型的AI应用有什么启发?
2、Genspark Super Agent 放弃了已经有 500 万用户的搜索产品,all in AI Agent,你觉得这个决定是明智的吗?
3、文章提到 Genspark Super Agent 在 GAIA 基准测试中表现优于部分 OpenAI 模型和 Manus,但具体实现细节尚未完全披露,你认为这会对用户选择造成影响吗?

原文内容

整理|冬梅、核子可乐

前两天,总部位于美国加州帕洛阿尔托的初创公司 MainFunc 发布了所谓的 Genspark Super Agent,这是一个能快速反应的自主系统,可自主思考、计划、行动并使用工具来帮助用户处理所有日常任务。

那么,这款 AI Agent 什么来头,又具体能做什么?

Genspark Super Agent 背后的公司 MainFunc 成立于 2023 年年底,创始人为景鲲(Eric Jing)和朱凯华(Kay Zhu)。景鲲曾担任百度旗下小度科技 CEO、百度集团副总裁、百度智能生活事业群组(SLG)总经理,百度人工智能产品委员会主席。 加入百度之前担任微软首席研发总监,负责微软必应搜索亚洲市场的研发工作,也是微软小冰的创造者。朱凯华曾任小度科技 CTO,加入百度之前担任谷歌主任架构师,是 Google Panda 等一系列核心算法的创造者。

该团队由来自微软、谷歌和百度的资深人士组成,约有 20 名成员,总部位于加州帕洛阿尔托和新加坡,并计划在西雅图开设新办事处。

这次他们发布的 GenSpark Super Agent 是一种新型通用 AI Agent,旨在自主处理跨领域的复杂任务。与简单的聊天机器人或脚本不同,GenSpark Super Agent 可以像人类助手一样“思考、计划、行动和使用工具”。它不仅可以生成文本,还可以代表用户采取行动。当用户向 Super Agent 提供高级指令(类似于项目简介或 SOP),它将在内部分解问题、制定计划并在最少的监督下逐步执行该计划。这意味着它可以执行多步骤任务,例如研究信息、转换数据,甚至执行现实世界的操作(例如打电话),而无需持续指导。

在架构上,Super Agent 的独特架构采用“混合代理”设计,集成了八种不同的大型语言模型 (LLM)、80 多种内部工具和十多个精选数据集。根据复杂性、速度和准确性需求,每个任务都会智能地路由到最佳模型,确保高效、精确地执行。

Genspark 背后的故事

2024 年,MainFunc 发布了其首款产品,Genspark,即“AI Agentic Engine”,定位为专注于提供搜索服务的 AI Agent 引擎。凭借创新理念,Genspark 迅速跃升至 Product Hunt 每日新品榜单第四位。

2024 年 6 月,MainFunc 完成了由新加坡 BlueRun Ventures 领投的 6000 万美元种子轮融资,使该公司的估值达到 2.6 亿美元。这笔资金将加速 Genspark 的发展和市场扩张。

今年 2 月,MainFunc 又被爆已在 A 轮融资中筹集了 1 亿美元,估值达到 5.3 亿美元。

Genspark 之所以受到如此多的关注,是因为它不仅仅是一个搜索引擎,还是一个 AI 代理引擎,旨在利用 AI 提供高质量的搜索体验。它的特点是能解决传统搜索引擎的诸多缺点,例如无休止的广告、有偏见的信息以及大量不相关的结果。

Genspark 背后的创新在于其独特的“Sparkpages”概念。Sparkpages 是由专业 AI 代理生成的定制页面,提供公正、可靠的信息,不受 SEO 驱动的内容干扰。这些页面通过提供更有意义和更有价值的搜索结果,为用户节省了宝贵的时间。

积累 500 万用户后,转战 Super Agent

目前,Genspark 主要面向美国市场,免费提供,未来计划推出付费订阅模式。

近日,MainFunc 公司 CTO 朱凯华在 Product Hunt 上发布的一封信中表示:“我们做出了一个违反直觉的决定——尽管旗下 AI 搜索产品已覆盖超过 500 万用户,但我们还是要将其放弃。至于理由,是因为我们认为传统 AI 搜索已经过时。”

朱凯华分享了公司过去 9 个月构建这款 Super Agent 的经历。

在景鲲所做的演示中,Genspark 的 Super Agent 规划了为期五天的圣地亚哥之旅,计算了景点之间的步行距离,绘制了公共交通选项,然后使用语音呼叫代理预订餐厅,包括处理食物过敏和座位偏好。另一个演示展示了代理通过生成食谱步骤、视频场景和音频叠加来制作烹饪视频卷轴。

这些可能听起来以消费者为中心,但它们展示了技术的发展方向——多模式、多步骤的任务自动化,模糊了创意生成和执行之间的界限。

“解决这些现实问题比我们想象的要困难得多,”景鲲在视频中说道,“但我们对所取得的进展感到非常兴奋。”

一个引人注目的功能:Super Agent 清晰地可视化了其思维过程,追踪其如何推理每个步骤、调用哪些工具以及原因。实时观察逻辑的执行,让系统感觉不像黑匣子,而更像合作伙伴。它还可以激励企业开发人员在自己的 AI 系统中构建类似的可追踪推理路径,使应用程序更加透明和可信。

预定义的工作流程无法扩展

当 Perplexity 于 2022 年底亮相时,曾经激发人们对于 AI 颠覆搜索这一潜力的关注和期待。这是因为此前的搜索查询遵循严格的工作流程:分析查询并扩展关键字;检索排名最靠前的 Web 结果;将其重新排序 / 总结为最终响应。

虽然这套框架足以解决基本问题,但对于更复杂的需求,例如比较技术解决方案、规划多因素采购决策或者处理深度研究,这样的框架显然力有不逮。

在 Genspark,团队起步阶段也以同样的流程构建起自己的 AI 搜索引擎,之后做出逐步改进:

使用专门的数据源(学术、金融、旅游、产品等)以丰富信息内容。通过并行搜索自动触发对复杂查询的深入调查。交叉检查异步智能体以验证那些过于复杂而无法快速即时处理的语句,随后进一步扩展为数据搜索与深度研究智能体。采取混合智能体方法以对抗幻觉,由多个智能体相互验证彼此输出。

朱凯华表示,虽然这些创新方法显著提高了搜索质量并扩大了用户群体,但他们意识到整套设计仍受到传统思路的束缚,即依然遵循固定且预先定义的工作流程。为了真正建立起拥有强大适应性且丰富上下文的解决方案,团队必须全面摆脱束缚。这一认识促使他们打造出超级智能体——一种整合所有过往改进,且不受静态步骤序列约束的全新范式。

Super Agent 中的工程适应性设计

Genspark Super Agent 不再强制每条查询经过固定的工作流程,而是根据手头问题进行灵活调整。它会规划各个步骤,使用最佳工具或子智能体、观察结果并实时调整策略,且时常表现出令我们惊讶的卓越创造力。如果一种方法失败,超级智能体会丝滑过渡至另一种方法,规模化模拟人类的问题解决方法。

这样的灵活性既体现在广度层面(即从哪些数据源或 API 中提取数据),也体现在深度当中(即进行了多少轮迭代改进)。对于较为简单的任务,它不会在非必要步骤上浪费时间;而对于较复杂的任务,它可以继续挖掘,直到找出令人满意的答案。它还可以根据每位用户的需求定制其输出结果——包括直接回答、Sparkpage(文章)、演示文稿、生成图像、交互式 HTML 页面,甚至是语音通话。

大模型、工具与精选数据三位一体

  动态编排与模型引导

Genspark Super Agent 通过混合智能体框架协调八大专用大模型。其中每套模型均经过预告引导,确保在所分配的角色当中表现出色,具体涵盖快速响应、深入分析等领域。这样的层次结构既保障了稳定性,同时也最大限度发挥了每种模型的独特优势。

  专用工具与子智能体

技术团队预先设计的子智能体库涵盖从演示生成器及 Python 代码执行器,到呼叫模块的多种组件。每个子智能体都针对可靠性和效率进行了优化,确保超级智能体可以处理图表创建、交互式页面开发等任务,且确保用户不会被限制在僵化的工作流程当中。

  值得信赖的精选数据

超级智能体会访问经过认真验证的数据集,这些数据内容来自高质量 Web 来源、值得信赖的合作伙伴以及专家审查过的存储库。离线验证智能体则不断审核并完美这些数据。通过优先考虑准确性而非数量,最大限度减少了错误信息并确保输出的可靠性。

经验教训:减少控制、增加工具

随着从僵化 AI 搜索引擎过渡至更加顺畅且具备自适应能力的超级智能体,Genspark 团队也发现了一项基本原则:减少控制、增加工具。过于结构化的工作流程会限制创造力与功能深度,而引入多个专业智能体以解决问题的不同方面、并赋予其选择及切换多种工具的自由度,则有望释放出更大的能力。

  • 减少控制:规定性流程往往会限制探索范畴,导致体系更难适应新的挑战。采取更开放的策略则有助于促进创新与韧性。

  • 增加工具:为智能体配备专门的灵气检索、分析、呈现与通信模块,使其能够实时制定端到端解决方案。这不仅有助于支持高级用例,同时也能保证任务的轻量化与执行效率。

这种将自适应、多样化工具支持与经过审查的数据相融合的探索,使得 Genspark 超级智能体比任何传统 AI 搜索产品都更加灵活且可靠。面对如此显著的优势,Genspark 团队才会毅然决定放弃已经蓬勃发展的 AI 搜索方案,专注于超级智能体所代表的新方向。

在基准测试中击败 Manus

那么,与其他 AI Agent 比较,GenSpark 表现如何?

通过广泛的模型集成和直接使用 API 来与 Manus AI 和 OpenAI Operator 等竞争对手区分开来。虽然 Manus AI 主要依赖较少的模型并提供较少的集成工具,但 GenSpark 更广泛的工具集和现实世界的交互功能(包括语音呼叫)提供了额外的实际优势。与仅限于基于浏览器的操作的 OpenAI Operator 相比,GenSpark 以 API 为中心的方法可以实现更快、更结构化的数据检索和更丰富的任务执行功能。

业内专家指出,Super Agent 的多智能体设计代表了 AI Agent 技术的一个重要趋势。相较于传统的单模型系统,这种混合架构不仅提升了任务处理的灵活性,还显著降低了错误率和“幻读”(产生不准确内容)的概率。例如,在 GAIA 基准测试中,Super Agent 的表现优于部分 OpenAI 模型和 Manus,证明了其在自动化任务执行中的高可靠性。这一优势在对准确性和可控性要求较高的场景中尤为突出。

不过,Super Agent 的推出也带来了一些悬而未决的问题。有评论指出,其多代理系统的具体实现细节尚未完全披露,在极其复杂的任务或资源受限的环境中的表现仍需进一步验证。此外,随着人工智能代理技术的普及,确保数据隐私和系统透明性也将是 Genspark 未来需要解决的挑战。

Genspark Super Agent 允许用户在无需个人凭证的情况下开始测试。

参考链接:

https://www.marktechpost.com/2025/04/05/meet-genspark-super-agent-the-all-in-one-ai-agent-that-autonomously-think-plan-act-and-use-tools-to-handle-all-your-everyday-tasks/

https://venturebeat.com/ai/gensparks-super-agent-ups-the-ante-in-the-general-ai-agent-race/

https://mainfunc.ai/blog/genspark_kill_aisearch

https://mainfunc.ai/blog/genspark_moa_powered_search

https://www.producthunt.com/posts/genspark-super-agent

 会议推荐

AICon 2025 强势来袭,5 月上海站、6 月北京站,双城联动,全览 AI 技术前沿和行业落地。大会聚焦技术与应用深度融合,汇聚 AI Agent、多模态、场景应用、大模型架构创新、智能数据基建、AI 产品设计和出海策略等话题。即刻扫码购票,一同探索 AI 应用边界!


今日荐文

图片
你也「在看」吗?👇

我觉得这个理念挺有意思的。咱们在开发AI应用的时候,经常想着把所有流程都设计得死死的,生怕AI“乱来”。但实际上,过度控制反而会限制AI的创造性和适应性。增加工具,就像给AI配备了十八般兵器,让它能根据不同情况选择合适的工具来解决问题。 这种思路可以应用在很多领域,比如智能客服。与其预设一堆固定回复,不如让AI自主学习,并提供各种API接口(工具),让它能根据用户的问题,灵活调用不同的服务,提供个性化的解决方案。

这个决定挺大胆的!放弃已经有一定用户基础的产品,转向一个充满不确定性的新方向,风险肯定不小。但从长远来看,我觉得这可能是一个正确的选择。传统搜索的市场格局已经很成熟了,竞争非常激烈。而AI Agent 还是一个新兴领域,充满了机会。如果 Genspark 能够在这个领域取得领先地位,未来的发展空间会更大。

肯定有影响啊!就像买东西一样,我们都想知道产品的具体参数和性能指标。如果 Genspark 不公开细节,用户就无法对其进行全面评估,可能会选择其他更透明的产品。 当然,也有些人可能不在乎这些细节,只要觉得好用就行。但对于那些对技术要求比较高的用户来说,透明度是很重要的。

从学术角度看,这其实是一种trade-off。减少控制意味着降低了系统的可预测性和稳定性,增加了不确定性风险。增加工具则提高了系统的灵活性和潜在能力,但也增加了复杂性和维护成本。在实际应用中,我们需要根据具体场景,权衡利弊,找到一个平衡点。

从信息经济学的角度来看,这是一种信息不对称。Genspark 掌握了更多的信息,而用户只能通过有限的信息来做出决策。这种情况下,用户往往会更加谨慎,可能会选择那些信息更充分的产品,或者寻求第三方的评测报告。

我觉得这是一种常见的商业策略。一方面,他们可能想保护自己的技术秘密,避免被竞争对手抄袭。另一方面,他们可能希望通过保持神秘感,吸引更多人关注。 但是,过度的保密可能会适得其反,让用户产生不信任感。毕竟,AI 领域最重要的是信任,用户需要相信AI是可靠、安全和可控的。

我个人认为,这是一个具有战略眼光的决策。传统搜索模式已经触及天花板,而AI Agent 代表了下一代智能交互方式。虽然短期内可能会损失一些用户和收入,但从长期来看,这有助于他们在新兴市场中抢占先机,建立竞争优势。 也有可能500w用户基本没啥付费意愿,还不如all in做新故事。

从商业角度来看,这个决定是否明智,取决于他们对未来趋势的判断和对自身能力的评估。如果他们认为AI Agent 代表了搜索的未来,并且有信心在这个领域胜出,那么这个决定就是值得的。但如果只是盲目追逐热点,而没有充分的准备,那么可能会面临很大的风险。 500w日活,说放弃就放弃,我酸了,这得是多少钱。

“减少控制、增加工具”这个思路其实和现在流行的“涌现”概念有点像。我们没办法预测AI在拥有足够多的工具和数据后会产生什么样的行为,但是我们可以通过提供丰富的工具,让AI在探索中找到最佳解决方案。这有点像搭积木,我们提供各种形状的积木(工具),让AI自己搭建出各种奇妙的建筑(解决方案)。