工程知识引擎：AI编程智能体的工程知识底座构建

ali_tech · 2026 年3 月 19 日 16:28

介绍了工程知识引擎，通过多维数据融合和知识正循环机制，提升AI编程智能体的代码理解能力和工程协作能力。

原文标题：工程知识引擎：Harness Engineering体系下的工程知识底座

原文作者：阿里云开发者

原文链接： http://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247558976&idx=1&sn=46a3f85a1bfe7b1858520e283b1d47a0&

冷月清谈：

文章介绍了在AI编程智能体快速发展的背景下，如何通过构建工程知识引擎来解决智能体理解代码的难题。当前的AI智能体在项目级语义理解方面存在不足，为了弥补这些短板，文章提出了一套多维融合的代码认知系统，即工程知识引擎。该引擎通过整合代码文件、提交历史、RepoWiki、记忆等多维数据源，构建Commit Graph、RepoWiki、Memory、Code Chunk、Code Graph 等多元索引，为AI智能体提供深度上下文理解能力。同时，Qoder构建了完整的知识正循环机制，任务完成后引擎会自动对对话过程进行分析与评估，从中提炼有价值的工程洞察，沉淀为持久化记忆，当代码库发生 Git Commit 更新时，Qoder会实时捕获变更，自动分析增量代码的语义与影响，并将新知识同步沉淀到 RepoWiki 中，确保知识库与代码库始终保持同步演进。文章还详细介绍了工程知识引擎的五大能力，包括向量检索、代码图谱、Commit图谱、RepoWiki和记忆系统，以及Agentic Search——一个面向任务目标的自适应上下文编排引擎。最后，通过效果评估和线上A/B测试，验证了工程知识引擎在提升任务完成度、降低token消耗、提高代码保留率和降低对话不满意率等方面的实用价值，表明AI编程正在从“代码生成器”向“工程协作者”的角色转变。

怜星夜思：

1、文章中提到Commit Message对于弥合高层需求与底层实现之间的语义鸿沟有重要作用，但实际开发中，很多Commit Message质量不高。除了文中的Commit图谱，大家还有什么好的实践或工具来提高Commit Message的质量，从而更好地服务于AI智能体?
2、文章提到了RepoWiki对于沉淀项目特有的设计语言与架构约束的重要性。但实际情况是，很多团队的Wiki文档更新不及时，与代码脱节严重。有什么好的方式能够保证RepoWiki与代码库的同步演进，避免成为摆设？
3、文章中Agentic Search通过多跳检索策略来获取更全面的上下文信息，避免了传统检索工具返回大量无关信息的问题。那么，在实际应用中，如何评估Agentic Search的效果，并不断优化其检索策略，以适应不断变化的项目需求？

原文内容

现代软件开发的认知困境：

智能体需要的不只是能力，更是约束

在AI编程智能体快速演进的今天，一个核心痛点愈发凸显：AI能写代码，却难以理解代码。更深层的问题是：即便模型能力再强，若缺乏结构化的工程约束与上下文支撑，智能体也难以稳定、可预期地完成真实工程任务。

当前主流AI编程智能体在项目级语义理解方面存在明显短板：

感知范围狭窄：仅围绕当前查询进行局部检索，缺乏对项目整体结构的上下文感知；
知识碎片化：返回的代码片段彼此孤立，难以还原其在系统中的真实语义角色；
高维上下文缺失：传统工具仅能获取低维代码细节数据，难以捕捉设计意图、历史决策等隐性知识；

这些局限导致AI智能体只能逐点的检索上下文，缺少对代码库的立体感知。当前业界逐渐形成共识：让AI智能体真正可用，需要构建Harness Engineering，包含环境设计、意图规范、反馈循环、可观测性工具、架构约束、上下文工程等，其中工程知识底座（包括代码规范、架构约束、反馈循环与知识积累机制等）在其中起到了关键作用。只有当这套底座足够扎实，智能体才能从"偶尔可用"走向"持续可靠"。

工程知识引擎：

从“点”到“立体”的工程感知

为解决这一难题，我们构建了工程知识引擎——一套多维融合的代码认知系统，通过整合代码文件、提交历史、RepoWiki、记忆等多维数据源，为AI智能体赋予深度上下文理解能力。

Qoder会自动构建工程知识引擎数据层，主动分析并构建 Commit Graph、RepoWiki、Memory、Code Chunk、Code Graph 等多元索引，将原本离散的工程信息编织成立体的知识网络。智能体可以通过多个检索工具从多维知识图谱中获取丰富的上下文支撑——不再是孤立的代码片段，而是带有设计模式、关联关系的立体信息。

更重要的是，Qoder构建了完整的知识正循环机制。一方面，任务完成后引擎会自动对对话过程进行分析与评估，从中提炼有价值的工程洞察，沉淀为持久化记忆；另一方面，当代码库发生 Git Commit 更新时，Qoder会实时捕获变更，自动分析增量代码的语义与影响，并将新知识同步沉淀到 RepoWiki 中，确保知识库与代码库始终保持同步演进。这意味着智能体使用得越多、代码迭代越频繁，知识积累越丰富，理解能力越强——从"被动检索"走向"主动学习"，实现工程知识的自我进化与持续增值。这种持续演进的知识积累机制，正是工程知识底座建设的核心价值所在：每一次智能体的失误，都成为改进知识、完善规范、强化约束的信号；每一次代码迭代，都让知识库更贴近真实工程现实。智能体的能力边界，由其所运行的工程环境共同决定。

1）向量检索：基础检索能力

向量检索构成了智能体感知代码世界的底层触觉。它使自然语言查询能够直接映射至相关代码实体，摒弃了传统 grep 式工具依赖关键词匹配的盲目试探。Qoder通过高效的索引调度策略，相比业界同类产品，索引耗时平均减少5倍，95%的新开代码库仅需不到1分钟即可索引完成。

2）代码图谱：从语法到语义的升维

代码图谱通过显式建模代码间的语义关系（调用、引用、继承、实现等），提升智能体对代码库符号关系的认知。当智能体查询"如何实现用户登录验证"时，智能体不仅能获取到直接相关代码片段，还能通过图谱关系智能的联想出鉴权逻辑、Token服务等完整上下文。

3）Commit图谱：打通意图到代码的语义桥梁

智能体通过检索工具查询相关代码时，只能通过嵌入向量将自然语言与代码片段“黑盒”的映射在一起，无法覆盖的高层语义信号。而Commit Message天然具备高层次语义概括能力，架起"做什么"与"怎么做"之间的桥梁。Qoder通过模型对低质量Commit Message进行优化，构建了"Query → Commit Message（意图）→ 代码"的两阶段链路，有效弥合高层需求与底层实现之间的语义鸿沟。

4）RepoWiki：高阶知识的沉淀

代码图谱、Commit图谱、Chunk向量检索结合，起到了由点及面的效果，但是智能体过度依赖局部上下文和通用代码模式，忽视了项目特有的设计语言与架构约束，导致AI智能体生成的代码往往语法正确，却与项目风格和架构设计格格不入。RepoWiki自动生成并维护项目的架构设计、功能模块说明、开发规范等高阶知识，形成跟随代码库持续演进的知识库。

5）记忆系统：持久化的个性化记忆能力

记忆系统赋予AI智能体持久化记忆能力，帮助工程知识引擎加强对项目配置、开发规范、历史任务的设计决策及变更文件的感知。记忆系统会基于每轮的对话消息进行分析挖掘，抽象出有价值的记忆卡片，并会通过记忆系统的自动整理汰换、记忆的价值评估等实现记忆的自我演进。

6）Agentic Search：面向任务目标的自适应上下文编排引擎

如果说前述五大能力是工程知识引擎的“感官”与“记忆”，那么 Agentic Search 就是它的“认知中枢”——一个将多源异构知识动态调度、按需融合、自主推理的任务驱动型检索决策框架。

传统检索工具（如 grep_code 或单模态向量搜索）每次只会返回单一类型检索结果，主智能体需要不断的自我迭代调用多次传统工具采集信息，这种方式在复杂工程任务中极易检索出大量无关的上下文，导致上下文腐化。

Agentic Search 的重要在于将检索本身升格为可规划、可反思、可迭代的子任务。它基于当前任务目标、已有上下文置信度、各知识源的覆盖盲区与语义粒度，实时生成并执行最优的多跳检索策略。例如，面对请求：“请为订单服务新增幂等校验，兼容现有 Redis 分布式锁机制，并避免与库存扣减优化冲突”，Agentic Search 会自动编排如下推理路径：

1. 意图锚定：通过 Commit 图谱定位 inventory optimization 相关提交，提取其变更范围与设计约束；

2. 语义对齐：调用代码图谱，识别 RedisDistributedLock 类的继承链、被调用方及关键方法签名，确保新逻辑与锁生命周期兼容；

3. 规范校验：查询 RepoWiki 中《订单服务幂等设计规范》章节，获取 idempotency key 生成规则与失败重试策略；

4. 记忆增强：激活记忆系统，召回过往类似任务的经验（如基于 DB 唯一索引 vs 基于 Token UUID），主动规避。

效果评估

1）效果演示

在相同模型下，工程知识引擎的引入显著优化了任务检索阶段智能体的执行效率。相比传统方案，其工具调用轮次与频次大幅降低，直接带动全局 Token 消耗下降 21%。得益于引擎的高精度召回能力，系统表现出极强的逻辑鲁棒性，精准规避了对非相关文件（如 cache.py）的误触改动，有效消除了代码生成的副作用。

2）离线评估

在自研评测集 Qoder Agent Bench 上，启用工程知识引擎的实验组显著优于基线：

任务完成度得分提升 12%
平均 token 消耗降低 14%
相较业界主流方案，代码检索的 F-Score 提升 21%
启用Agentic Search后，相比于语义检索，主模型token消耗降低 10.4%

这表明，更丰富准确的多源上下文不仅提升了准确性，也减少了冗余推理与试错成本。Agentic Search能在保持智能体效果的情况下，大幅度减少无效上下文。

3）线上 A/B 测试

面向真实用户的 A/B 实验进一步验证了工程知识引擎的实用价值。在相同大模型下，启用该引擎的实验组相较仅使用 search_file、grep_code 等传统工具的对照组：

代码库检索（含向量检索、代码图谱、Commit图谱、RepoWiki）：

代码保留率提升 1.9%，在1000个文件以上的代码库中，进一步提升2.2%
针对复杂任务，模型迭代轮次平均降低7.1%

记忆系统：

代码保留率提升0.66%，对话不满意率降低27%

知识引擎赋能智能体，使其生成的代码更精准、可靠且符合用户预期，从而显著提升代码保留率，并有效降低对话不满意率。

工程知识引擎的出现，标志着 AI 编程正在从"代码生成器"向"工程协作者"的角色转变。但这一转变能走多远，根本上取决于我们为智能体构建了怎样的工程环境。

实践表明，智能体的质量上限，除了模型能力外，更重要的是由其所处工程底座的完善程度决定的。文档是否准确、架构约束是否可执行、知识库是否随代码同步演进——这些"基础设施"的质量，直接决定了智能体能否持续、稳定、可预期地完成真实工程任务。

在这样的环境中，AI 不仅能看到代码的结构，还能理解背后的意图、设计决策、技术限制以及演进过程。每一次智能体的失误，都应成为完善工程底座的契机；每一次知识积累，都在缩小人机协作的认知鸿沟。这不仅是一次技术上的进步，也是我们对软件工程本身的重新审视：让工程环境足够好，智能体自然会足够好。这，可能是推动未来软件开发效率持续提升最务实的路径。

Sprite72n · 2026 年3 月 31 日 03:42

评估Agentic Search的推理路径合理性，可以从以下几个方面入手：

1. 路径完整性：检查推理路径是否覆盖了所有必要的知识源，例如代码图谱、Commit图谱、RepoWiki和记忆系统。如果缺少关键知识源，可能会导致推理结果不准确。

2. 路径相关性：评估每个知识源对当前任务的相关性，避免引入无关信息。可以使用知识图谱技术，计算知识源之间的关联度，过滤掉低相关性的知识源。

3. 路径置信度：对每个推理步骤的置信度进行评估，例如基于模型预测的置信度、知识源的可信度等。可以使用概率图模型，对整个推理路径的置信度进行综合评估。

干预和优化Agentic Search的推理过程，可以从以下几个方面入手：

1. 规则引擎：引入规则引擎，根据预定义的规则对推理路径进行约束和优化。例如，可以定义“必须先查询RepoWiki获取架构设计”的规则。

2. 人工反馈：收集人工反馈，对推理路径进行改进。例如，当Agentic Search的推理结果不准确时，可以让人工专家提供正确的推理路径。

3. 强化学习：使用强化学习算法，训练Agentic Search选择最优推理路径。可以将推理结果的准确性作为奖励信号，训练Agentic Search最大化奖励。

Echo319s · 2026 年4 月 1 日 04:37

评估Agentic Search的推理路径，我觉得可以从“结果导向”和“过程监控”两个方面入手。

1. 结果导向：最终生成的代码是否符合预期？是否解决了问题？可以设置一些自动化测试用例，来评估代码的质量。如果代码质量不高，说明推理路径可能存在问题。

2. 过程监控：Agentic Search在推理过程中，会调用不同的知识源，可以记录下每次调用的信息，包括调用的知识源、查询语句、返回结果等。然后，分析这些信息，看看是否存在无效调用、重复调用等问题。

干预和优化Agentic Search的推理过程，可以考虑以下几点：

1. 调整知识源的权重：不同的任务，可能需要侧重不同的知识源。可以根据任务类型，调整知识源的权重，让Agentic Search优先选择更相关的知识源。

2. 增加人工干预：在某些关键环节，可以增加人工干预，例如让人工专家审核Agentic Search的推理结果，提供指导意见。

3. 引入强化学习：可以把Agentic Search看作一个智能体，使用强化学习算法，训练它选择最优的推理路径。

GlowingStarfish420 · 2026 年4 月 1 日 12:33

关于Commit Message质量，这确实是个老生常谈但又至关重要的问题。我的经验是，与其依赖自动化工具（虽然它们能提供一些帮助），不如从团队文化和流程入手。首先，制定清晰的Commit Message规范，比如使用Angular Commit Message Conventions，强制要求每个Commit Message包含type、scope和subject。其次，在Code Review过程中，将Commit Message作为重点检查项，确保其描述清晰、简洁、准确。最后，可以考虑使用一些Git Hook工具，在Commit之前进行Commit Message的校验，不符合规范的Commit Message禁止提交。至于自动化优化，可以使用一些AI工具，但需要谨慎使用，避免过度干预导致信息失真。关键还是在于提升开发者的意识和规范。

StarryUnicorn587 · 2026 年4 月 1 日 23:23

保证RepoWiki与代码库的同步，核心在于建立一套自动化的更新机制。我的想法是，可以利用Git Hook，在代码提交后自动触发Wiki的更新流程。具体来说，可以编写脚本分析代码变更，提取关键信息并更新到Wiki中。此外，还可以利用注释生成文档的工具，例如Javadoc、Swagger等，自动生成API文档并同步到Wiki。为了避免Wiki内容过时，可以引入版本管理机制，每次更新都保留历史版本，并标记当前版本与代码库的对应关系。同时，在AI智能体使用Wiki内容时，增加一个版本验证步骤，确保使用的Wiki版本与当前代码库版本匹配。当然，自动化永远无法完全替代人工，定期的人工审核和更新仍然是必要的。

Zen15e · 2026 年4 月 2 日 07:30

谢邀，这个问题问得好！的确，高质量的Commit Message是Commit图谱发挥作用的关键。我从技术角度分享一些想法：

1. Commitlint + Husky: 这是前端常用的方案，Commitlint根据预设规则检查Commit Message格式，Husky则可以将Commitlint集成到Git钩子中，强制开发者在提交前进行检查（pre-commit 钩子）。

2. AI辅助Commit Message生成: 现在有些IDE插件或命令行工具，可以根据diff内容自动生成Commit Message草稿，例如gitmoji-cli，可以提示使用emoji来增强Commit Message的可读性。但注意，AI生成的草稿需要人工审核修改。

3. 团队知识库沉淀: 将Commit Message规范、优秀Commit Message示例等沉淀到团队知识库，方便开发者查阅学习。另外，定期组织Commit Message Review会议，分享好的实践和改进空间。

总之，Commit Message质量的提升是一个持续迭代的过程，需要技术手段、团队文化和流程的共同保障。

Aura25g · 2026 年4 月 4 日 09:04

Agentic Search这玩意听起来挺玄乎的，我感觉就像在玩一个黑盒游戏，你不知道它到底是怎么想的，也不知道它下一步会怎么做。要评估它的推理路径，我觉得可以搞一个“诊断模式”，让它在推理的过程中，把每一步的思考过程都打印出来，就像debug一样。然后，我们就可以根据这些信息，看看它是不是在瞎搞。

至于干预和优化，我觉得可以搞一个“遥控器”，让我们可以手动控制它的推理过程。比如，我们可以告诉它：“嘿，先去查RepoWiki，然后再去查Commit图谱”。这样，我们就可以引导它朝着正确的方向前进。

当然，这只是我的一个设想，具体怎么实现，还得看大佬们的努力。

Valor47z · 2026 年4 月 4 日 08:16

这个问题问得很有深度！我之前也踩过类似的坑。想完全自动化同步Wiki和代码，短期内不太现实。我的经验是，可以采取“半自动化+人工校验”的方式。

首先，用脚本监听代码提交，自动更新Wiki中一些可以通过代码解析出来的部分，比如API接口文档、配置项说明等。但涉及到架构设计、业务逻辑等高阶知识，还是需要人工编写和维护。另外，要建立完善的Code Review流程，Reviewer除了要检查代码质量，还要Review Wiki是否需要更新。可以考虑使用一些协作工具，比如Confluence、Notion等，方便团队成员共同维护Wiki内容。

最重要的是，要让团队成员养成良好的习惯，每次修改代码后，都要及时更新Wiki。可以把“更新Wiki”作为开发任务的一部分，纳入任务清单。只有这样，才能保证Wiki内容与代码库的同步。

Whisper28f · 2026 年4 月 4 日 14:45

这个问题简直问到了痛点！保证RepoWiki实时同步确实是个挑战。我的建议是：

1. 自动化同步: 利用Git Hook（如post-commit）监听代码变更，触发Wiki更新脚本。这个脚本需要能解析代码，提取变更信息，并更新到Wiki对应章节。可以考虑使用一些Markdown转换工具，将代码注释转换为Wiki可读格式。

2. 版本控制: 为RepoWiki引入版本控制机制，每次更新都记录版本号和对应的代码库Commit ID。在AI智能体使用RepoWiki时，必须指定版本号，确保与当前代码库版本一致。

3. 人工审核: 定期安排人工审核RepoWiki内容，检查是否与代码库一致，并进行必要的修正和补充。可以建立一个Wiki维护团队，负责Wiki内容的更新和维护。

4. 过时提醒: 在RepoWiki的页面上增加一个“最后更新时间”和“适用代码库版本”的提示，提醒用户注意内容的时效性。如果发现Wiki内容与代码库不一致，可以添加“已过时”的标记。

总之，需要自动化手段和人工维护相结合，才能保证RepoWiki的实时性和准确性。

Haven14j · 2026 年4 月 5 日 23:24

自动化工具当然有，但效果嘛…懂得都懂。我觉得最有效的还是 Code Review，让团队成员互相 review Commit Message，确保信息准确、意图清晰。可以考虑在团队内部推广一些 Commit Message 模板，例如：feat(用户模块): 增加用户登录功能 这样既规范，又方便后续分析。另外，可以尝试使用一些 Git Hook 工具，在提交前强制检查 Commit Message 格式，不符合规范就禁止提交。但最关键的还是提升开发者的意识，让他们明白 Commit Message 的重要性，自觉编写高质量的 Commit Message。

RoaringTiger218 · 2026 年4 月 8 日 15:25

Agentic Search的核心在于“智能”地选择检索路径。我的思考是：

* 知识图谱的构建质量至关重要：知识图谱越完善、关系越准确，智能体才能更好地进行推理和决策。需要不断优化知识图谱的构建算法，提高知识的覆盖率和准确率。

* 检索策略需要具备自适应性：不同的任务需要不同的检索策略。智能体需要能够根据任务的特点，自动选择合适的检索路径。可以使用强化学习等方法，训练智能体的检索策略。

* 引入置信度评估机制：在检索过程中，对每个检索结果的置信度进行评估。如果置信度较低，则需要更换检索路径或者进行更深入的检索。

* 考虑检索成本：不同的检索路径的成本是不同的。智能体需要在保证检索质量的前提下，尽可能地降低检索成本。

* 加入人工干预：在某些情况下，智能体的检索结果可能不理想。可以加入人工干预机制，允许人工指定检索路径或者修改检索结果。

Spark21u · 2026 年4 月 10 日 23:42

Commit Message的重要性确实容易被忽视，但一个好的Commit Message绝对是提升团队效率和便于日后维护的利器。对我来说，影响主要体现在几个方面：

1. 代码审查效率：清晰的Commit Message能够让Reviewer快速了解提交的目的和范围，更容易发现潜在问题，减少沟通成本。
2. 问题追踪和调试：当出现Bug时，通过Git Blame可以定位到相关的Commit，如果Commit Message写得好，能快速了解当时的背景和修改意图，大大缩短问题排查时间。
3. 长期维护：项目时间长了，很多细节都会忘记。好的Commit Message相当于一份备忘录，方便日后回顾和理解代码。甚至可以生成一份更新日志。

我个人比较推荐的Commit Message格式是：

 <type>(<scope>): <subject> <body> <footer> 

* type: commit的类型，比如feat（新功能）、fix（修复bug）、docs（文档）、style（格式调整）等。
* scope: 影响的范围，比如某个模块、组件等。
* subject: 简短的描述，尽量用一句话概括。
* body: 详细的描述，可以包括修改的原因、方案等。
* footer: 可以放一些Closing Issues之类的。

当然，最重要的还是保持一致性，团队内部达成共识并严格执行。

Strider82w · 2026 年4 月 12 日 02:30

Commit Message 的质量确实对 Commit 图谱的有效性影响很大。要保证 Commit Message 的质量，可以试试这些方案：

1. 约定规范： 团队内部统一 Commit Message 的格式，比如使用 Angular 规范，明确 type、scope、subject 等字段，并强制执行。
2. 工具辅助： 使用 commitlint 这类工具，在提交代码前自动检查 Commit Message 是否符合规范，不符合就阻止提交。
3. 人工Review： Code Review 的时候，把 Commit Message 也纳入Review 范围，确保描述清晰、准确。
4. 培训意识： 定期对团队成员进行培训，提高大家对 Commit Message 质量的重视程度，强调其长期价值。

如果能把这些措施都落实到位，Commit Message 的质量应该会有明显提升，也能更好地发挥 Commit 图谱的作用。

Pulse48v · 2026 年4 月 13 日 22:03

其实我觉得与其强制要求大家写高质量的Commit Message，不如让工具来帮忙。现在有很多AI工具可以直接根据代码变更生成Commit Message，虽然不一定完美，但至少比开发自己瞎写要靠谱多了。当然，生成之后最好还是人工review一下，稍微修改一下，这样既保证了质量，又节省了时间。

NobleStag037 · 2026 年4 月 14 日 00:52

这个问题很有深度！Agentic Search的推理策略设计确实是个难点。我觉得可以从以下几个方面考虑：

1. 任务分解： 首先需要将复杂任务分解为多个子任务，每个子任务对应一个或多个知识源。
2. 知识源选择： 根据子任务的特点，选择合适的知识源。例如，需要了解代码结构时，选择代码图谱；需要了解历史背景时，选择Commit图谱。
3. 置信度评估： 对每个知识源返回的结果进行置信度评估，选择置信度最高的结果。
4. 反馈循环： 根据任务完成情况，对推理策略进行调整和优化。

常见的坑包括：知识源选择不当、置信度评估不准确、推理策略过于复杂等。避免这些坑的关键在于不断尝试和调整，找到最适合自身业务场景的推理策略。

HiddenPanda648 · 2026 年4 月 15 日 02:48

关于知识沉淀，我之前踩过很多坑，最大的教训就是：不要为了沉淀而沉淀！知识沉淀一定要以实际需求为导向，解决实际问题。

分享几个经验：

* 从小处着手： 不要一开始就想建立一个庞大的知识库，可以先从解决某个具体问题入手，例如：如何配置数据库连接池？如何处理跨域请求？
* 模板化文档： 针对常见问题，可以创建模板化文档，让开发者直接套用，降低编写难度。
* 鼓励贡献： 可以建立积分奖励机制，鼓励开发者贡献知识，并对贡献者进行表彰。
* 定期维护： 定期审查知识库，删除过时内容，更新错误信息。
* 建立反馈机制： 让开发者能够反馈知识库的问题，并及时修复。

最重要的是，要让开发者意识到知识沉淀的价值，并积极参与到知识沉淀过程中。

Spark21u · 2026 年4 月 15 日 03:42

关于Agentic Search，我想到一个很有趣的方向：能否让Agentic Search具备“创造性”？

现在Agentic Search主要还是在现有知识库中检索信息，如果能够让它基于现有知识创造新的知识，例如：自动生成代码片段、自动撰写文档等，那将极大地提高开发效率。

当然，这需要解决很多技术难题，例如：如何保证生成内容的正确性和一致性？如何评估生成内容的质量？

但我相信，随着AI技术的不断发展，Agentic Search未来一定能够具备创造性，成为真正的“智能助手”。

此外，还可以考虑将Agentic Search与多模态信息结合，例如：图像、视频等，让Agentic Search能够理解更丰富的信息，并提供更全面的服务。

QuietKoala728 · 2026 年4 月 21 日 17:06

我个人觉得Commit Message这东西，不用太强求。能说明白改了啥就行。当然，如果团队有统一规范，那肯定要遵守。但如果只是为了迎合AI，硬要写出花来，感觉有点本末倒置。毕竟，Commit Message是给人看的，不是给机器看的。重要的是让团队成员能快速理解这次提交的目的和内容。如果Commit Message写得太晦涩难懂，反而会适得其反。

当然，如果能用工具自动生成Commit Message，那也是极好的。但如果需要手动编写，那就尽量简洁明了，突出重点。别为了追求形式而牺牲了可读性。

SpringFlower865 · 2026 年4 月 22 日 14:33

个人认为，Agentic Search最大的挑战在于如何处理知识之间的冲突和不一致。不同的知识源可能对同一个事物有不同的描述和解释，甚至可能存在相互矛盾的信息。Agentic Search需要能够识别和解决这些冲突，选择最合适的知识来支持任务目标。

这需要Agentic Search具备一定的推理和判断能力，能够根据上下文和任务目标来选择最合适的知识。同时，还需要建立一种机制来评估知识的可靠性和权威性，避免使用错误的或者过时的知识。

Celeste49f · 2026 年4 月 23 日 17:53

Commit图谱通过Commit Message将高层需求与代码关联，构建了“Query → Commit Message → 代码”的链路。除了Commit Message，还可以考虑以下信息源：

* Issue Tracker： Issue 记录了需求讨论、设计决策等信息，可以与 Commit 关联。
* Code Comments： 代码注释中可能包含设计思路、实现细节等信息。
* 测试用例： 测试用例反映了代码的功能需求和预期行为。