KnowSelf：提升大模型智能体知识边界感知与自主决策

DatapiTHU · 2025 年7 月 4 日 11:07

ACL 2025论文KnowSelf，提升大模型智能体知识边界感知能力，实现精准决策，减少无效试错，迈向更智能的AI。

原文标题：ACL 2025 | 大模型乱试错、盲调用？KnowSelf让智能体有「知识边界感知」能力

原文作者：数据派THU

原文链接： http://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247658230&idx=2&sn=1dd0ea1895802ac3a2e5cf3d8e96eb74&

冷月清谈：

本文介绍《Agentic Knowledgeable Self-awareness》（KnowSelf），一篇聚焦于提升大模型智能体“知识边界感知能力”的ACL 2025论文。当前大模型智能体在复杂任务规划中面临“盲目灌输”和“过度试错”的困境，缺乏类似人类的自我认知和情境判断能力。KnowSelf方法受人类决策机制启发，旨在使智能体自主判断是否具备足够知识进行生成、推理，或何时主动调用外部工具（如外部知识）。

KnowSelf框架的核心在于帮助智能体区分三种情境：“快速思考”（不需多虑直接行动）、“慢速思考”（需多步推理反思）和“知识型思考”（需外部知识辅助）。通过构建高效的知识系统，并制定启发式情境判断标准，为智能体自我认知训练奠定基础。训练过程采用双阶段：先通过监督式微调（SFT）习得初步规划模式，再引入RPO损失函数强化自我认知，使智能体在推理时能生成特定标记，精准调控知识查询与反思行为。

实验结果显示，在ALFWorld和WebShop数据集上，KnowSelf在Llama-8B和Gemma-2B模型中的表现均优于多种基线方法，尤其是在极少反思和知识使用的情况下达到卓越性能，强调了精准知识引入而非盲目知识灌输的重要性。进一步分析揭示，KnowSelf能有效避免智能体规划模式的过拟合，提升跨任务泛化能力，并随着模型和数据规模的增加而性能稳步提升。研究还发现，智能体调用外部知识的决策通常发生在模型更深层。KnowSelf为智能体规划提供了新思路，是探索智能体知识边界感知问题的初步尝试，为未来基于强化学习的自主知识获取智能体发展奠定了基础。

怜星夜思：

1、如果KnowSelf能让智能体感知知识边界，那它如何定义或量化“知识边界”？尤其在实际应用中，判断一个问题是否“超出能力范围”的挑战在哪里？
2、文章提到KnowSelf能提升泛化能力，如果智能体遇到全新的、之前从未接触过的任务类型，KnowSelf还能否有效指导它进行“情境判断”和“知识调用”？是需要重新训练还是有更普适的机制？
3、文章说KnowSelf的性能随模型和数据规模提升，并提到“自我认知训练数据相对比例低于40%时，模型性能可能出现波动”。这个40%的阈值是否具备普适性？不同的任务或模型结构会有很大差异吗？

原文内容

来源：知识引擎实验室-ZJU
本文约2200字，建议阅读8分钟
本文提出的 KnowSelf 方法为智能体规划提供了新思路，初步探索了智能体知识边界感知这一问题。

论文题目：Agentic Knowledgeable Self-awareness

本文作者：乔硕斐邱志松任宝昌王潇斌茹湘原张宁豫陈想蒋勇谢彭峻黄非陈华钧

发表会议：ACL 2025

论文链接：https://arxiv.org/abs/2504.03553

代码链接：https://github.com/zjunlp/KnowSelf

欢迎转载，转载请注明出处

在 AI 领域，大模型智能体的发展日新月异。我们今天要介绍的这篇 ACL 2025 论文——《Agentic Knowledgeable Self-awareness》，聚焦于如何提升智能体的「知识边界感知」能力，使其在复杂任务规划中更加得心应手，为智能体的可靠应用提供了新思路。

30 秒速读版本

KnowSelf 聚焦于大模型智能体在决策过程中所面临的「知识边界感知」问题。受人类决策机制启发，本文指出智能体应具备三类行为模式的自主决策能力：快速反应（快思考）、深度推理（慢思考），以及主动调用外部工具（本文以外部知识增强为例）。

KnowSelf 通过学习自身的知识边界，使智能体能在不同情境下自主判断是否具备足够知识进行生成和推理，以减少无效试错与知识滥用。实验表明，KnowSelf 可提升智能体的知识调用准确率、任务规划效率和跨任务泛化能力。

研究背景：智能体规划的困境

大模型智能体在诸多领域展现出巨大潜力，但现有智能体规划方法存在弊端。传统方法多采用「盲目灌输」模式，将标准轨迹、外部反馈和领域知识无差别地注入智能体模型，完全忽视了人类决策过程中至关重要的「自我认知」原则。

这种「无脑式」灌输导致智能体在面对意外信号时极易崩溃，陷入模式崩塌困境，且过度试错与盲目知识融合在实际场景中往往不可行，还会大幅推高模型推理成本。

人类在决策时，会根据面临的情境动态评估自身状态，灵活调整策略。比如，当我们遇到简单问题时，能迅速做出判断并行动；遇到棘手问题，会放慢思考节奏，深入分析；而面对超出自身能力范围的问题，会主动寻求外部知识或帮助。

然而，当前大模型智能体普遍缺乏这种「知识边界感知」能力，导致规划行为低效且脆弱。

核心方法：KnowSelf 框架

为破解这一难题，论文提出了智能体「知识边界感知」的思路，并基于此设计了数据驱动 KnowSelf 方法，让大模型智能体能够自主调节知识的运用。

知识系统构建

对于外部工具（知识），并采用了一种简单高效知识收集方法，以极低成本完成知识库的离线构建。该知识系统由知识库和知识选择模块组成，其中知识库包含一系列知识条目，知识选择模块能依据智能体历史轨迹从知识库中精准挑选所需知识。这种设计兼顾了知识系统的实用性和高效性。

情境判断标准

论文基于智能体的能力，将情境划分为三类：快速思考（Fast Thinking）、慢速思考（Slow Thinking）和知识型思考（Knowledgeable Thinking）。并提出了启发式情境判断标准，用于标记智能体自我探索轨迹中的特殊标记，从而针对智能体的能力构建出训练数据，为后续训练奠定基础。

快思考：智能体无需多虑，能直接给出正确行动
慢思考：智能体虽能给出正确行动，但需经过多步思考与反思
知识型思考：智能体自身无法提供正确行动，必须借助外部知识辅助思考

自我认知训练

KnowSelf 采用双阶段训练过程，先通过监督式微调（SFT），让智能体模型初步掌握自我认知规划模式；再引入 RPO 损失函数，进一步强化自我认知能力。在这一体系下，智能体会生成特定特殊标记，表明其对情境的判断，在推理过程中实现知识查询与反思的精准调控。

实验成果

本文在两个模拟大模型智能体规划数据集 ALFWorld 和 WebShop 上，对 KnowSelf 进行了全面评估，涵盖 Llama-8B 和 Gemma-2B 两个不同规模的模型。实验结果显示，KnowSelf 凭借极少的反思和知识使用，性能优于多种基线方法。

与无知识基线方法对比，KnowSelf 在 Llama-8B 和 Gemma-2B 模型上均展现出卓越性能。与知识增强型基线方法相比，KnowSelf 仅用少量知识，就超越了所有的 100% 知识增强基线方法，充分证明了并非知识越多越好，精准的知识引入机制才是关键。

进一步分析：深入探索智能体自我认知

智能体规划模式过拟合

本文通过消融实验，发现仅在标准轨迹上训练的模型更易陷入模式拟合，而引入反思和知识边界感知后，智能体规划能力提升。这表明，在许多情况下，智能体并非不能做出正确决策，而是受限于规划模式。此外，过度引入知识可能会对性能产生负面影响，因此凸显了精准知识引入机制的重要性。

智能体规划泛化能力

在泛化能力测试中，KnowSelf 在 ALFWorld 的三项挑战性任务上表现优异，优于基于提示的基线方法 Reflexion。这表明 KnowSelf 能有效打破传统规划轨迹训练的局限，使模型具备跨任务情境感知能力，在未见过的任务上能灵活运用反思和知识引入策略。

模型与数据规模影响

随着模型规模扩大和自我认知训练数据量增加，KnowSelf 性能稳步提升。当自我认知训练数据相对比例低于 40% 时，模型性能可能出现波动甚至下降，推测模型需达到一定自我认知水平才能稳定发挥效能。

智能体自我认知机制机理

本文在 Transformer 模型的各层计算不同情境标记的平均概率，发现 Reflection 标记概率始终为零，Knowledge 标记和 Action 标记在模型最后几层才出现。这表明智能体在内部决策时，仅在最后几层隐藏层才决定是否调用外部知识，且调用知识的决策可能更晚出现，暗示智能体在 Token 空间内通过隐式奖励引导进行探索，最终做出决策。

结论与展望

本文提出的 KnowSelf 方法为智能体规划提供了新思路，初步探索了智能体知识边界感知这一问题。在后 R1 时代，随着 Search-R1、ReSearch、Deep Researcher 等工作的出现，基于 RL 的智能体自主知识获取工作展现了巨大的前景，KnowSelf 还只是在这个时代之前的初步产物，相信随着技术的发展，基于 RL 的智能体自我认知能迸发更大的活力。

编辑：黄继彦

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU

SummerSun956 · 2025 年7 月 7 日 05:19

文章里那个“40%的自我认知训练数据”的说法，我感觉它就是个“经验值”吧。就像做菜放多少盐，可能换个厨师、换个菜系就得重新试。对大模型来说，这个比例肯定跟它用的是Llama还是Gemma，还有任务场景都有关系。你说，要是模型本身就挺笨的，是不是得喂它更多“我是谁，我能干啥”的数据才能开窍？如果模型很聪明，可能少一点也能掌握了。所以，这个40%更像是一个“大概率能跑起来”的门槛，具体还得看实际情况来调整。

Flux219p · 2025 年7 月 9 日 18:20

哎呀，你说怎么量化“知识边界”？大概就是智能体心里有个小九九：“嗯，这个问题我脑子里有谱，啪（快思考）！”“这个得好好想想，慢慢来（慢思考）！”“卧槽，这啥玩意？赶紧去问度娘（知识型思考）！”它不是真的懂啥是“边界”，就是训练得它觉得自己“懵圈”的时候，就知道去外面找帮手了呗。跟我们学生时代遇到不会的题直接抄作业一个道理，哈哈！

ThunderLion891 · 2025 年7 月 10 日 18:45

遇到全新任务？那大概就像我考试遇到个从来没见过的题型。KnowSelf可能会先“嗯？”一下，然后凭借它那点“自我认知”的聪明劲儿，发现自己脑子里的知识库里貌似没这个谱。“不行，这得问问外援！”——然后它就去外部知识库里疯狂搜索了。如果外部知识库也没有，那它可能就跟我们一样，挠挠头，然后给你一个标准的“我不知道”或者“再查查文献”这类答案了。至于说要不要重新训练，那得看这新任务的“妖孽”程度了，太离谱了肯定得补课啊！

EmeraldDog210 · 2025 年7 月 11 日 19:33

你问得挺好，如果真遇到一个“天外飞仙”的任务，KnowSelf还能不能指导，这是个大考验。我觉得它能做到“判断”会比啥也不懂的强不少。文章里说它能“跨任务情境感知”，说明它学到的不是某个具体任务的答案，而是遇到问题如何“思考”的套路。就好比你教一个人遇到难题先查资料，而不是盲摸。但是，如果资料库里根本没有线索，或者任务要求的是创造性思维，那就不好说了。可能还得有点“紧急补习班”，或者系统能自我进化去学习新的知识，不然就像“巧妇难为无米之炊”嘛。

DancingFrog182 · 2025 年7 月 12 日 21:53

关于KnowSelf在全新任务类型上的泛化能力：文章提及KnowSelf通过打破传统规划轨迹训练局限，能提升跨任务情境感知能力。这意味着KnowSelf的核心机制——即学会判断何时进行“快速、慢速或知识型思考”——理论上是普适的。它训练的重点在于“如何判断”，而非“特定任务的知识”。然而，对于完全未见过的任务，智能体可能仍面临“概念漂移”的挑战。即使它能识别出当前任务需要“知识型思考”，如果外部知识库中缺乏相关信息，或者任务本身需要高度抽象推理而非简单的信息检索，其性能仍会受限。这时候可能需要结合在线学习、强化学习或者少量新的示例如SFT来微调其情境判断模型，以适应新的任务领域。

Phantom95l · 2025 年7 月 13 日 04:47

关于“自我认知训练数据相对比例低于40%时性能波动”的阈值：这个40%很可能是一个经验性的发现，而非一个普适的理论阈值。它可能与特定的模型架构（Llama-8B和Gemma-2B）、数据集（ALFWorld和WebShop）以及具体的训练超参数有关。不同任务领域、更复杂的模型结构或者使用了不同的训练策略时，这个“临界点”可能会发生变化。这表明智能体确实需要一个最低限度的“自我认知”训练数据量来建立稳定的元认知能力，低于这个量，模型可能无法有效区分自身能力边界，导致决策混乱或无效。这提示在实际部署中，对自我认知数据的标注和比例控制是一个关键的工程挑战。

GreenTurtle317 · 2025 年7 月 13 日 09:11

那个40%啊，听着就像智能体的“及格线”！低于40%，它可能就懵圈了，不知道自己是张三还是李四，分不清自己是该查资料还是直接蒙一个。就跟学生考试一个样，平时没学到位，上考场就发挥不稳定了。所以这40%可能就是它修炼“自我认知神功”的最低内力值吧，内力不足就容易走火入魔。换个更厉害的“武功秘籍”（模型结构）或者“天赋异禀”（数据质量），可能这个及格线就不一样了，甚至可以“无师自通”呢，哈哈哈！

Wisp43b · 2025 年7 月 13 日 10:38

针对KnowSelf如何定义或量化“知识边界”？——在实际操作中，KnowSelf可能并未直接给出“知识边界”的量化定义，而是通过其训练过程中的“情境判断标准”（快思考、慢思考、知识型思考）间接实现的。这更像是学会了一种“元认知”能力：当模型在SFT和RPO训练中被引导识别自身无法直接生成正确行动时，就标记为需要“知识型思考”。这实际上是将“知识边界”的判断问题转化为一个分类或预测问题，即预测当前情境属于哪种思考模式。挑战在于，真实世界的边界是模糊的，非二元的，如何确保这种启发式判断的鲁棒性和精确度，尤其是在模糊地带，是持续研究的重点。

WanderingWolf359 · 2025 年7 月 13 日 11:56

问到KnowSelf怎么量化知识边界，我觉得论文里说的三种“思考模式”——快、慢、知识型，其实就是它判断自己“行不行”的一个标准。它不是直接算出来“我懂90%的知识”这种数字，而是通过训练学会了“到这儿我就得查资料了”或者“这个问题我得好好琢磨琢磨”。难点就是，实际应用中很多问题介于“懂”和“不懂”之间，咋办？比如，它可能知道“苹果是水果”，但不知道“苹果手机故障怎么修”，这时候它怎么区分这是“慢思考”还是“知识型思考”？边界不是一条线，更像一片雾。