面壁智能李大海:AI智能体的未来在于模型本身,而非工作流

面壁智能CEO李大海认为,AI智能体的未来在于模型本身,而非工作流。端侧模型优势明显,Agent发展需关注模型能力提升。

原文标题:面壁智能 CEO 李大海:AI智能体的未来是模型,而非工作流

原文作者:AI前线

冷月清谈:

面壁智能CEO李大海在中关村论坛上分享了关于端侧AI和智能体Agent的洞见。他强调端侧模型与端侧AI的区别,前者指完全在本地运行的大模型,具有数据安全和突破网络限制的优势。他认为,大模型是智能体Agent的基础,模型能力升级能推动应用生态发展。当前Agent的短板在于规划能力、长期记忆和任务表现。因此,未来的方向是提升模型本身的能力,实现“模型即Agent,模型即产品,模型即交互”。面壁智能已将端侧模型应用于汽车、手机等领域,并发布了首个纯端侧汽车助手cpmGO,以提升智能座舱体验。

怜星夜思:

1、文章提到目前Agent智能体存在规划能力不足、长期记忆薄弱等问题,你认为除了模型本身,还有哪些因素会影响Agent的性能表现?我们应该如何改进这些问题?
2、文章中说“模型即Agent,模型即产品,模型即交互”,你如何理解这句话?你觉得未来所有的AI产品都会走向“模型即一切”的模式吗?
3、面壁智能推出了端侧模型小钢炮,并将其应用于汽车等领域。你认为端侧AI未来还有哪些潜在的应用场景?在哪些场景下,端侧AI会比云端AI更有优势?

原文内容

 整理 | 褚杏娟

一直以来,面壁推出的”面壁小钢炮“MiniCPM 端侧模型,在全球开源社区广受好评。伴随着端侧智能在全球范围内,日益成为大模型落地的关键场景,我们也作为端侧模型代表团队,受到越来越热切的关注。这段时间,面壁智能 CEO 李大海在中关村论坛上回应了一些热点问题。

首先,伴随端侧智能日渐火爆、玩家越来越多,常有朋友问:“又有某某公司布局端侧 AI 了,和你们小钢炮相比,是一样的路线吗?”

李大海表示,首先,端侧 AI 和端侧模型之间存在本质的区别。如今,提到端侧 AI,更多强调的是“端侧”这一场景,包括在手机、PC、汽车等等场景中发生的人与智能的交互,其背后的模型,既可以部署在云端也可以部署在本地。

而端侧模型则专指完全在本地进行计算和运行的大模型。与云侧模型相比,端侧模型具有不可替代的优势——不仅能有效避免数据上云、解决用户数据和隐私安全的顾虑,还能够突破网络环境的限制。

”随着端侧模型性能的不断提升,我们已经多次实现了超越预期的表现,甚至在某些特定场景中,屡屡取得超越云端的卓越成绩。小钢炮,拥有自信的底气!“李大海说道,”在端侧部署中,软硬件的完美适配至关重要。以汽车行业为例,我们已全面适配各类主流芯片,实现毫秒级的惊人响应速度,为用户带来流畅而极致的智能交互体验。“

第二个问题,面壁长期被业内称为”最懂 Agent 的大模型公司“,最近不少公司都加入 Agent 大军了,怎么没听到面壁有什么动静?

对此,李大海表示,”作为智能体研究的前沿探索者,我们认为大模型与 Agent 是一体两面、密不可分的关系。当大模型需要与环境进行交互、为人服务并进入生产环节时,就可以认为它已经具备了 Agent 智能体的特性。基座大模型,在 Agent 智能体能力的发挥中,起着举足轻重的作用。“

李大海比喻大模型与 Agent 的关系,如同西红柿就是番茄,马铃薯就是土豆,把大模型送去上班就是 Agent。

如今,大家越来越能体会到,每当模型版本迎来重大更迭或能力实现质的飞跃时,往往会吞没上一代模型所支撑的全部应用生态。当前的 Agent 智能体,亦存在诸多短板——如规划能力不足、长期上下文记忆薄弱、长期任务表现不佳等通病,这使得目前的 Agent 智能体难以支撑稳定且持续的高效交互。

”我们愈发认识到,模型本身,而非工作流,才是未来 AI 智能体的发展方向—— 模型即 Agent,模型即产品,模型即交互。把小钢炮,这个端侧模型送去上班,就是 Agent!“李大海说道。

目前,面壁端侧模型已成功在汽车、手机、具身智能、AIPC、智能可穿戴设备等多个主流方向推进「就业」,逐步形成了繁荣的落地应用生态。

演讲中,李大海发布了小钢炮超级助手 cpmGO——首个纯端侧智能助手。

据悉,小钢炮超级助手 cpmGO,作为首个纯端侧汽车助手,在智能座舱方面具有跨越舱外至舱内的全链条感知、决策与执行能力,实现了端到端的智能化应用。它具有视觉、语音、多模态、图形 UI 交互、融合感知、意图判断与执行等丰富能力库,为智能座舱带来了感知与智能的全面升级。通过端云协同,可以充分地赋能智能座舱产品,提升用户体验。

声明:本文为 InfoQ 整理,不代表平台观点,未经许可禁止转载。

 会议推荐

AICon 2025 强势来袭,5 月上海站、6 月北京站,双城联动,全览 AI 技术前沿和行业落地。大会聚焦技术与应用深度融合,汇聚 AI Agent、多模态、场景应用、大模型架构创新、智能数据基建、AI 产品设计和出海策略等话题。即刻扫码购票,一同探索 AI 应用边界!


今日荐文

图片
你也「在看」吗?👇

我觉得Agent的性能问题不能只看模型,数据质量也很重要。如果训练数据不够好,模型再强也训练不出来好的Agent。还有,Agent跟环境的交互方式也要考虑,好的交互方式能让Agent更好地学习和适应环境。改进的话,可以试试强化学习,让Agent在实际环境中不断学习,或者用更好的数据增强技术来提高数据质量。

我想到一个有点科幻的应用场景:可穿戴设备。未来的可穿戴设备,比如智能眼镜、智能服装,如果能嵌入端侧AI芯片,那就可以实现很多有趣的功能,比如实时翻译、健康监测、增强现实等等。由于涉及隐私和安全,端侧AI在这种个人设备上的应用会更有优势。

除了汽车,我觉着端侧AI在智能家居领域潜力巨大。想想看,家里的各种设备,比如摄像头、音箱,如果都能直接在本地进行AI计算,那就不用担心隐私泄露了,而且响应速度也会更快。比如,智能门锁可以实时识别人脸,智能音箱可以根据你的语调判断你的情绪,这些都是端侧AI的优势。

大家有没有想过,Agent的性能瓶颈可能在于认知架构的设计?现在很多Agent都是基于单一的大模型,但人类的认知是多模块协同的。也许我们可以尝试设计更复杂的认知架构,比如加入记忆模块、推理模块、行动模块等等,让Agent更像一个真正的人工智能。

端侧AI在工业领域也有很多机会。比如,可以用在生产线上的质量检测,实时识别产品缺陷,或者用在机器人上,让机器人更自主地完成任务。在这些场景下,端侧AI的优势在于低延迟和高可靠性,可以保证生产效率和产品质量。

这句话的背后是AI发展的趋势,以前我们需要手动设计很多规则和流程来实现AI功能,但现在强大的模型可以直接学习和模拟这些规则,甚至做得更好。但是,我认为“模型即一切”太绝对了,AI产品最终还是要服务于人,用户体验和交互设计仍然很重要。好的模型加上好的交互,才能做出真正优秀的产品。

谢邀,同意楼上的观点。我补充一点,“模型即一切”有成为现实的潜力,但是,当前的模型在可解释性和安全性方面还存在很多挑战。如果模型做出的决策无法解释,或者存在潜在的风险,用户很难信任和使用它。所以,在追求模型能力的同时,我们也需要关注模型的可解释性和安全性,这是AI产品走向成熟的关键。

从工程角度分享下我的看法,Agent的稳定性和可靠性跟整个系统的架构设计息息相关。特别是对于需要长期运行的Agent,我们需要考虑容错机制、监控机制、以及快速恢复能力。举个例子,我们可以使用微服务架构来构建Agent系统,这样每个模块都可以独立部署和更新,从而降低整个系统的风险。

“模型即Agent,模型即产品,模型即交互”这句话,我的理解是,未来的AI应用会越来越依赖底层模型的强大能力,模型本身就提供了足够智能化的服务,不再需要复杂的中间层。至于是否所有AI产品都会走向这个模式,我觉得不一定,要看具体的应用场景。对于一些需要高度定制化和灵活性的场景,可能还是需要更复杂的工作流和交互设计。