LLM自进化:2026年AI的关键趋势?

Agent 应用发展迅速,LLM 静态属性成瓶颈,自进化(Self-Evolving)成新焦点,或为 2026 关键词。

原文标题:Self-Evolving 会是 2026 关键词吗?

原文作者:机器之心

冷月清谈:

文章探讨了在 2025 年 Agent 应用快速发展背景下,LLM 的“静态属性”逐渐成为 AI 发展瓶颈的问题。业界开始重视 LLM 和 Agent 的“自进化”(Self-Evolving)能力,并聚焦于构建“持续适应系统”。

文章分析了 Self-Evolving 的发展历程,从最初对 LLM 思维链数据、模型组件和综合提升的探索,到后来发现强化学习并非唯一答案,改善模型记忆系统或加强模型内在元认知学习能力同样重要。同时,企业开始寻求能够独立承担端到端流程的“Autonomous Worker”,这进一步推动了对具备自进化能力系统的需求,使其能够在无需人类频繁干预的情况下处理长尾问题和动态异常。

文章还提到了 ICLR 2025 和 ICLR 2026 等人工智能顶会,它们开始关注 Self-Evolving 的相关主题,但同时也指出,业界尚未在概念上明确到底是什么构成了所谓的“自进化”,因此需要成体系地梳理该领域的研究框架。

怜星夜思:

1、文章提到 LLM 的“静态属性”是 AI 发展的瓶颈,那么除了自进化之外,还有没有其他方法可以缓解这个问题?
2、文章中提到“企业开始寻求能够独立承担端到端流程的 Autonomous Worker”,你认为 Autonomous Worker 在哪些领域最有潜力率先落地?
3、文章提到 ICLR 等顶会开始关注 Self-Evolving,但业界对“自进化”的概念尚未明确,你认为“自进化”最核心的特征是什么?

原文内容

本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。

在过去的 2025 年里,Agent 应用的极速发展使得 LLM 的「静态属性」局限被视为 AI 发展的关键瓶颈,业界对 LLM 和 Agent 的自进化(Self-Evolving)能力愈发重视,开始聚焦于构建「持续适应系统」。然而,该领域仍然缺乏区分短暂性能提升与通用能力和自主性真正进步的共同标准。有思潮认为通过统一新兴标准并鼓励集体探索,该领域正在面临巨大的机遇。


目录

01. Self-Evolving 在过去一年里有何进展?
为什么「Self-Evolving」越来越重要?学界和工业重视模型自进化能力的原因有哪些?...
02. Self-Evolving 的研究重点在如何演变?

「Self-Evolving」如何从思想实验变为工程现实?上半年和下半年的综述如何解构 Self-Evolving范式?AI顶会更关注哪些工作?...

03. 2026 年的 Self-Evolving 工作都在关注哪些问题?

如何在零数据环境下训练搜索增强型Agent?算法代码优化领域的自进化方法有何特征?元认知学习如何塑造自进化能力?...


Self-Evolving 在过去一年里有何进展?

1、2025 年里,LLM 能力的进步极大推动了 AI 的发展,使 AI Agent 应用开始渗透于各类任务与场景,也因而暴露出因「静态」属性所导致的局限。

① LLM 的「静态」(Static)属性指当遇到新任务、不断发展的知识领域或动态交互场景时,它们无法调整内部参数。随着 LLM 大型语言模型越来越多地应用于开放式交互环境,这一局限性被视为 AI 发展的关键瓶颈。

2、对动态持续适应能力的需求催生了对构建能够实时动态调整感知、推理和行动的智能体的探索,业界对 AI 的「自进化」(self-Evolving/self-Improvement)能力愈发重视,焦点开始从「静态预训练模型」向「持续适应系统」的根本转变。[1-1] 

① 图灵奖得主 Richard Sutton 是早期推崇 AI 自进化能力的代表,他先后提出了「Dynamic Deep Learning」、「经验时代(Era of Experience)」「Oak」架构等概念与设计。

3、在技术探索中,自进化范式仍处于发展初期,因其研究涉及基础模型、强化学习和在线学习、认知神经科学等领域的不同实践和交叉影响,带来了学界在不同方向下的探索和尝试,以及共识和非共识的交替。

① 在 2025 上半年以及之前,许多工作从 LLM 的思维链数据、模型组件和综合提升等视角探索模型自进化的能力,也有如 Sakana AI 的「DGM」试图通过让模型基于过往经验来改进自身代码。(详见 Pro 通讯 2025 Week 28)

② 进入 2025 年下半年,进一步涌现的探索工作发现强化学习或许不会是自进化范式的唯一答案,改善模型的记忆系统,或是加强模型内在元认知学习(IML)能力同样对 LLM 的自我改进能力带来帮助。(详见 Pro 通讯 2025 Week43、Week 46)

4、在 LLM 与 Agent 应用所带来的经济效能层面,多篇对 2026 年 AI 发展的趋势展望指出,企业开始寻求能够独立承担端到端流程的「Autonomous Worker」。只有具备自进化能力的系统,才能在无需人类频繁干预的情况下,处理长尾问题和动态异常。[1-2] [1-3] 


Self-Evolving 的研究重点在如何演变?

1、人工智能顶会 ICLR 2025 首次在研讨会(Workshop)中设置了「Scaling Self-Improving Foundation Models」的主题,探讨没有人类监督的情况下如何通过生成合成数据来持续提升模型性能。[1-4] 

① 该场研讨会首先区分了自进化与标准的监督学习(SL)和强化学习 (RL) 在几个关键方面的区别,并探讨了自进化范式对学习方法、数据等方面的特殊需求。

2、在新年伊始,ICLR 2026 为自进化范式设置的研讨会主题聚焦于「AI with Recursive Self-Improvement」(RSI),讨论「如何为强大且可靠的自我改进人工智能系统构建算法基础?」[1-5] 

① 此前,ICLR 2025 的「世界模型」「Agent 工具使用」和 NeurIPS 2024「自主发现」等研讨会均探究过模型自进化能力,但通常强调单一模态、前沿模型规模或算法细节,而未详细说明部署仪器化和安全实践。

3、根据该场研讨会的描述,LLM 的进展已将 RSI 从思想实验转变为工程现实。修改自身提示词、目标函数或权重的训练循环,现已成为基础模型开发和一系列下游应用的核心组成部分。因此当下有关 RSI 的研究应当明确学习系统如何学会安全且可证明地改进自身。[1-5] 

① ICLR 2026 设置了「改变目标」「适应时机」「适应机制」「运行环境」和「证据维度组织」五个维度来评估新出现的自进化研究工作。

4、伴随对 AI 自进化能力的兴趣不断增加与正视,但业界仍未在概念上明确到底是什么构成了所谓的「自进化」,因此有工作开始成体系地梳理该领域的研究框架,并逐渐丰富和完善...


 关注👇🏻「机器之心PRO会员」,前往「收件箱」查看完整解读 


更多往期专题解读内容,关注「机器之心PRO会员」服务号,点击菜单栏「收件箱」查看。

我觉得最核心的特征是能够自主学习和适应环境。它不仅要能够从数据中学习,还要能够从错误中学习,并且能够根据环境的变化调整自己的行为模式。

我觉得楼上说的创造力有点太理想化了。我觉得更现实的自进化是能够不断地自我完善。例如,AI可以根据用户的反馈不断改进自己的回答质量,或者根据任务的难度自动调整计算资源。

我尝试从技术层面解释一下。改善记忆系统,可以考虑引入更先进的记忆模块,比如神经图灵机(NTM)或者可微神经计算机(DNC),这些模块可以增强LLM的长期记忆能力,使其能够更好地利用历史信息进行学习和推理。而元认知学习,则可以通过设计特殊的损失函数或者训练策略来实现,例如,让LLM学会评估自己输出结果的置信度,并根据置信度调整学习策略。

我倾向于认为自进化不应只关注模型本身,更应该关注反馈闭环的构建。能够从错误和反馈中学习,并调整自身行为,形成正向循环,是自进化的关键。如果模型只是被动地接受数据,而不能主动地从经验中学习,那就不算真正的自进化。

我个人认为在自动化客服领域最有潜力。Autonomous Worker 可以处理客户咨询、解决常见问题,甚至进行简单的销售。而且这个领域的数据积累比较丰富,容易训练出效果不错的模型。降低人工成本是企业追求的目标

从理论上讲,可以探索新的模型架构,例如基于神经形态计算的模型,可能更擅长处理动态变化的信息,从而从根本上解决“静态”属性带来的局限。不过这种方案可能需要比较长的时间才能有突破。

从工程角度来说,可以引入更频繁的微调机制,针对特定任务或场景定期更新模型参数。虽然不是完全的自进化,但也能让模型在一定程度上保持对新知识的敏感性。例如现在流行的RAG架构,其实也是一种弥补静态属性的手段

我认为“自进化”最核心的特征是模型能够在没有明确人工干预的情况下,持续地、自主地提升自身的能力。这种提升不仅仅是性能指标的提升,还包括对新知识的理解、对新环境的适应等等。换句话说,就是模型能够像生物一样,不断地学习和进化。

某些特定行业的流程性工作,例如财会、审计,重复度高、规则明确,也适合 Autonomous Worker 落地。但前提是需要保证数据的安全性和准确性,毕竟这些领域对错误的容忍度很低。

我觉得自进化的核心在于自主性。模型能够自主地探索、发现、并利用新的知识和技能,而不需要人工预先设定好学习路径。这就像一个探险家,自己决定去哪里,怎么走,而不是一个被导游牵着鼻子走的游客。