智谱推出首个免费智能Agent产品AutoGLM沉思,推理模型媲美DeepSeek-R1

智谱发布免费智能Agent产品AutoGLM沉思,具备自主推理和操作能力,推理模型GLM-Z1-Air性能比肩DeepSeek-R1,开启Agentic AI时代。

原文标题:第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1

原文作者:机器之心

冷月清谈:

智谱公司发布AutoGLM沉思,一款无需付费即可使用的智能Agent产品,标志着国产AI在自主智能体领域迈出重要一步。该产品最大的亮点在于其“动手能力”,能够像人类一样操作和浏览网页,充分利用各类信息源。AutoGLM沉思基于智谱全栈自研的Agent技术,包括新一代推理模型GLM-Z1-Air和基座模型GLM-4-Air-0414,前者性能比肩DeepSeek-R1,且速度更快、价格更低,智谱还计划开源Agent相关的模型和技术。AutoGLM沉思具备深度思考、感知世界、工具使用三大能力,通过模拟人类的推理和决策过程,探究开放式问题并根据结果执行操作,实现从数据检索、分析到生成报告的全流程。该产品的推出打破了海外AI公司的高昂价格门槛,预示着AI正在不断趋近理想状态,传统的复杂工作流将不复存在,用户将能体验到更便捷、高效的AI服务。

怜星夜思:

1、AutoGLM沉思提到能够通过AI孵化小红书账号,并且接到商单,这对内容创作和营销行业会带来什么影响?以后做小红书账号是不是只要给AI提需求就可以了?
2、AutoGLM沉思强调了其“动手能力”,能够像人一样操作和浏览网页。这种能力在哪些领域有应用前景?除了Research,还有哪些场景可以发挥它的优势?
3、智谱开源Agent相关的模型和技术,这对国内AI生态会产生什么影响?其他公司可以基于这些开源技术做什么?

原文内容

机器之心报道

作者:蛋酱


国产 AI 领域,从今天起有了既能深度研究又能动手操作的自主智能体产品。


这款神器叫做「AutoGLM 沉思」,来自中国公司智谱。


我们来看一个非常经典的案例:只需要输出你想讨论的话题,AI 就能自动去小红书、知乎等平台上深度查询、总结完整报告,并转化为面向大众的传播内容。短短 14 天里,AI 孵化出了一个 5000 多个粉丝的小红书账号,还接到了商单。


「起号」,从未如此简单高效:



3 月 31 日,智谱官宣了新一代 Agent 产品「AutoGLM 沉思」。


相比于此前 OpenAI 的 Deep Research 等产品,「动手能力」是 AutoGLM 沉思最大的亮点之一。它能够「边想边干」,像人类一样自动操作和浏览网页,这意味着知网、小红书、公众号、京东等优质却不对外开放 API 的信源都能被查看到,同时基于背后基座模型的多模态理解能力,这些网页上的图文信息也能被充分利用。


2025 年,大模型技术的演进来到了关键的新阶段:从单纯的语言模型到多模态模型,再到今天,我们终于看到了成熟的自主 Agent 产品,业内称之为「Agentic AI 时代」。更详细地说,我们触手可及的大模型应用已经从「生成式 AI 的单次响应」,真正升级为具备自主推理能力、指挥自身行动和工具调用的智能系统。


「AutoGLM 沉思」的面世,扛起了国产 AI Agent 落地的大旗。且在今天的发布后,「AutoGLM 沉思」即全量上线,免费开放给每一位用户。



体验方式:https://chatglm.cn/(下载「智谱清言」PC 客户端)


与此同时,我们也看到了智谱这家中国公司在 Agent 领域的领先技术布局,包括推理、多模态、记忆和工具。值得一提的是,「AutoGLM 沉思」基于的是智谱全栈自研的 Agent 技术,包括新一代推理模型 GLM-Z1-Air 和基座模型 GLM-4-Air-0414,前者性能比肩 DeepSeek-R1,在速度提升最高 8 倍的同时,价格仅需 DeepSeek-R1 的 1/30。


对于智谱来说,2025 年将是以「开源」为主题的一年。所有 Agentic 相关的模型和技术,包括基座模型 GLM-4-Air0414、推理模型 GLM-Z1-Air、沉思模型 Z1-Rumination、智能体框架,都将在 4 月 14 日正式开源。模型会在接下来的两周内,陆续上线智谱 AI 大模型开放平台(bigmodel.cn),惠及整个技术社区。


首个免费可用、具备强反思能力的 Agent 产品


智谱表示,「AutoGLM 沉思」可以视为自主智能体的「Preview 版本」,可以理解为 DeepResearch 和 Agent 的强强组合。


我们可以从三个方面去评价「AutoGLM 沉思」:


  • 深度思考:能不能模拟人类在面对复杂问题时的推理与决策过程。

  • 感知世界:能不能像人一样获取并理解环境信息。

  • 工具使用:能不能像人一样调用和操作工具,完成复杂任务。


打开智谱清言,说出自己的需求,也就是一段 Prompt,剩下的全部交给 AI:


Prompt:

分析问题:生成式 AI 技术对未来知识生产模式的颠覆性影响

具体要求:

对比传统学术研究与 AI 辅助研究的范式差异

选取至少 5 个典型领域(如医学、法学、文学,经济学,艺术学等)进行深度研究案例分析

字数要求一万字以上



它能探究开放式问题并根据结果执行操作,能够模拟人类「深度研究」的过程,从数据检索、分析到生成报告。


再来一个看看:


Prompt:我要去香港玩 3 天,请帮我设计旅游攻略,注意每个景点都要从小红书上查看网友的真实评论。



到这里,我们都应该看出来「AutoGLM 沉思」的优势何在了。


「AutoGLM 沉思」在一般 Deep Reseach 的基础上,叠加了 AutoGLM 操作电脑浏览器的环境交互能力,有效促进了模型思考的宽度和深度,自然输出的内容也就更全面了。这也是第一个 C 端可以使用的拥有强反思能力的 Agent 产品。目前,AutoGLM 沉思的平均思考步骤在 20 步以上,拥有处理复杂问题的能力。


目前上线的是「AutoGLM 沉思」Preview 版本,比较擅长 Research 相关场景。在未来的两周,产品还将增加更多的 Agent 执行能力。


另一方面,「免费开放」的意义值得重视。以 OpenAI 的 Deep Research 为例,虽然功能上非常吸引人,但被惊艳到的也只是付费 200 美元购买了 Pro 套餐的那一波会员。而「AutoGLM 沉思」选择「免费」开放给所有用户,这延续了智谱的传统,也瞬间打破了海外 AI 公司制定的高昂价格门槛。


「AutoGLM 沉思」背后

智谱在下一盘 Agent 的棋


在百舸争流的技术大变革时代,模型能力的领先始终是智谱这家公司位于行业内的核心竞争力。在「AutoGLM 沉思」面世之前,智谱围绕 Agent 的技术布局已经持续多年。


可以说,这家公司见证、参与、引领了 Agent 技术的几个重要发展阶段:


智谱清言是最早具备 Function Call 能力的大模型应用。早在 2023 年 10 月,智谱就在当时的 ChatGLM3 基座大模型和智谱清言中引入了代码交互能力,并支持 AgentTuning 技术,让模型实现了自主规划任务并调用工具完成任务。


2024 年初,伴随着 GLM-4 的发布,智谱清言上线了 GLMs 个性化智能体定制功能。用户无需编程基础,即可通过简单的提示词指令创建专属智能体,并通过智能体中心分享和调用。


到了 2024 年底,智谱开放了。这是智谱第一个产品化的智能体 Agent,可以做到让 AI 通过语音直接操纵硬件设备,还能跨不同 App 全局操作。


每一次更新,都伴随着智谱在相关技术研发的突飞猛进。「AutoGLM 沉思版」的推出,意味着智谱 Agent 产品的又一次重大迭代,背后是更强大的基础模型、推理、Agent 框架。


在这场发布活动上,智谱透露了「AutoGLM 沉思」背后的关键技术进展:


技术演进路径:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。


首先是推理模型 GLM-Z1-Air。GLM-Z1-Air 是智谱基于扩展强化学习技术训练的新一代推理模型,面对复杂、开放问题,能够进行推理和反思,为 Agent 提供了强大的推理、规划与反思能力。其效果比肩 DeepSeek-R1,提速 8 倍,价格是 R1 的 1/30,可以在消费级显卡上运行。


在性能表现上,GLM-Z1-Air 可以与 DeepSeek-R1(671B,激活 37B)媲美。智谱在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中对 GLM-Z1-Air 进行了评估,评估结果显示 GLM-Z1-Air 展现了较为强大的数理推理能力,为更多复杂任务的解决提供了支持。


GLM-Z1-Air 背后的基座模型是 GLM-4-Air-0414, 以 32B 参数量比肩更大参数量的国内外主流模型。它在预训练阶段加入了更多的推理类数据,并在对齐阶段针对智能体能力进行了优化,在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。



在 GLM-Z1 的基础上,智谱又通过强化学习训练了沉思模型 GLM-Z1-Rumination,提升了模型结合工具使用完成长程推理能力。



同时,智谱在 MAAS 平台上将免费模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,并推出了对应的推理版本 GLM-Z1-Flash,在保留大部分效果的情况下更轻量级、更高速,完全免费调用,以适用于更广泛的应用场景。


在落地进程方面,智谱也已经有了清晰的规划:「智谱将专注于在 AGI 和基座模型研发方向,我们未来很长一段时间将专注于 Agentic GLM 相关模型技术的研发上。我们在基座模型上搭建智能体平台,以便帮助我们的生态伙伴调用智谱智能体的能力,打造基于行业、地域和场景的智能体应用。在行业生态方面,我们是模型厂商的占位,我们希望帮助应用合作伙伴做出成功的大模型应用。在城市生态方面,我们依然是模型厂商的占位,通过与当地龙头企业合作来赋能当地产业升级与政务的智能化。」


「传统的复杂工作流将不复存在」


技术和产品的飞速迭代,将为每一个人带来什么?


举例来说,近日 OpenAI 为 GPT-4o 增加了原生的图像生成功能,从网友的反馈到机器之心的亲身体会,生成效果都可以说是「一骑绝尘」,不管是人物真实性还是内容一致性。对于「文生图」这一赛道来说,GPT-4o 树立了一个全新的标杆,让所有的竞争对手又紧张了一下,也让这条赛道重新活跃了起来。


更重要的是,它指出了 AI 正在不断趋近理想中的状态:「所有传统的、复杂的工作流都将不再存在。」一句话 P 图、一句话玩手机、一句话写报告…… 不管是图像的生成和持续编辑,还是设备操控,都指向这一终极形式。


因此,我们能够看到「AutoGLM 沉思」所具备的划时代的意义:当推理模型的「深度研究」结合 Agent 的「动手执行」,它能够模拟人在面对复杂问题时的思考、能够像人一样感知这个世界、能够像人一样使用工具。


Chatbot 同样具有交互性和功能性,而 Agent 与之最大的差异就是自主性和适应性。「AutoGLM 沉思」的价值在于,模型实现了自己决策操作过程,能够通过连续、多步推理实现模型自主规划,并通过反思实现动态调整,不需要提前设计工作流。


从此以后,我们不需要再设计复杂的智能体工作流。这就是自主智能体的雏形,不久后的我们,或许就能触摸到 AI 作为生产力工具的理想形态。


就像领域内最近在讨论的观点:我们所有人都在一架上升的电梯里,你可以站着不动,也可以原地俯卧撑。但最终,都能轻松抵达那个曾经遥不可及的高点。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


金融分析领域绝对是AutoGLM的用武之地。它可以自动抓取、分析各个网站的财务数据、舆情信息,生成投资报告。此外,在法律领域,AI可以辅助律师进行案例检索、法律条文分析,大大提高工作效率。甚至在电商领域,可以自动比价,寻找最优商品,或者模拟用户行为进行压力测试。

AI 辅助内容创作可能成为常态,但完全依赖 AI 可能会导致内容同质化和缺乏创意。小红书账号运营涉及到用户互动、情感连接等,目前AI还难以完全替代。但AI绝对是效率神器,以后做小红书可能真的只需要提需求了,剩下的交给AI优化。

开源意味着更多的可能性。其他公司可以基于智谱的开源模型进行二次开发,例如针对特定行业进行优化,或者加入新的功能。同时,开源也有助于技术的普及和发展,促进整个AI生态的繁荣。不过,开源也需要注意知识产权保护,避免出现恶意抄袭、侵权等行为。

细思恐极,以后会不会出现AI批量生成内容,然后AI之间互相点赞、评论、关注,形成虚假繁荣?这对平台治理会是一个巨大的挑战。感觉以后“人”设会越来越重要,只有足够真实才能脱颖而出。

智谱开源Agent相关技术,绝对是功德无量的事情。其他公司可以基于这些开源技术,快速构建自己的Agent应用,降低研发成本。可以预见,未来国内会出现一大批基于智谱开源技术的Agent产品,覆盖各个领域。

感觉国内又要卷起来了!一方面,开源降低了门槛,大家都可以参与进来;另一方面,也意味着竞争会更加激烈。想要在众多Agent产品中脱颖而出,需要有独特的创新和差异化。所以,开源是好事,但更需要有核心竞争力。

其实我觉得AutoGLM这种Agent最大的价值在于,它可以将人类从重复性的工作中解放出来。比如,过去我们需要花费大量时间进行信息搜集、整理、分析,现在这些工作都可以交给AI完成。我们可以将更多精力投入到创造性、战略性的工作中。

这个事情要辩证的看,AI起号确实可以大大降低成本,提高效率,但内容平台的核心竞争力还是优质内容。如果大家都用AI批量生产内容,那平台很快就会变成垃圾场。所以,AI可以作为辅助工具,但最终还是要靠优质的内容创作者。

我感觉在智能家居领域也很有潜力。AutoGLM可以学习用户的习惯,自动控制家里的电器、调节温度、甚至预定外卖。想象一下,你只需要说一句“我饿了”,AI就能自动帮你点好外卖,想想都很爽。这种Agent如果足够成熟,未来一人标配一个问题不大。