智能体AI赋能软件工程:规范先行与开发模式重塑

智能体AI模式正通过强化工程规范重塑软件开发。拥抱自动化、规范驱动,迈向更高效的AI辅助软件工程。

原文标题:智能体 AI 模式强化软件工程规范性

原文作者:AI前线

冷月清谈:

本文深入探讨了智能体AI模式如何通过强化核心工程规范来改进软件开发。Paul Duvall分享了他的智能体AI工程模式代码库,该代码库记录并演进AI辅助软件开发实践。文章强调,在AI生成大量代码的背景下,主干开发、尽早且频繁提交以及自动化测试变得更为重要。开发者与代码的交互方式也在转变,需要更多地依赖自动化验证与智能体防护机制。规范驱动开发等方法不断演进现有的软件工程实践,通过预先定义预期行为、约束条件与验收标准,让智能体能够依据清晰的规范生成并校验输出。此外,文章还讨论了意图定义的重要性,强调清晰的规范是驱动智能体产出一致且可预测结果的关键。通过结合左移实践与右移反馈,将行为定义与生产状态纳入验证流程,AI能够更全面地分析生产遥测数据,从而识别模式并更早地发现问题。

怜星夜思:

1、文章提到“不再逐行审查代码”,而是依赖自动化验证,你认为完全放弃人工Code Review是否可行?在哪些场景下必须坚持人工Code Review?
2、文章提到了“规范驱动开发”,你认为在AI辅助的软件开发中,规范的重点应该放在哪些方面?如何确保规范能够真正驱动AI的行为,而不是沦为形式主义?
3、文章提到了“右移实践”,将生产环境的反馈纳入开发流程,你认为在AI辅助的开发中,如何安全有效地进行“右移”?有哪些需要特别注意的地方?

原文内容

作者 | Rafiq Gemmail
译者 | 明知山

在最新一期的 AI DevOps 播客 中,Paul Duvall 探讨了随着现代模型能力的提升,智能体 AI 模式如何强化核心工程规范。他还分享了自己的 智能体 AI 工程模式 代码库,用于记录和演进 AI 辅助软件开发实践。

Duvall 是“Continuous Integration: Improving Software Quality and Reducing Risk”一书的作者,他将这一系列模式定位为:探索如何通过客户在实际工作中应用智能体 AI 的实践经验来适配已成熟的工程实践。他强调应让 AI 生成的内容基于共享模式,并指出:“当 AI 可以生成代码,工程实践比以往任何时候都更为重要。”

面对 AI 生成的海量代码,Duvall 强调了主干开发、尽早且频繁提交以及自动化测试的重要性,并解释说,随着变更速度加快,这些实践对保障质量至关重要。

Duvall 还描述了开发者与代码交互方式的转变。他发现,在处理 AI 生成的内容时,自己“不再逐行审查代码”,因为海量变更让这种方式越来越不切实际。对此,Duvall 强调应该更多地依靠自动化验证与智能体防护机制,包括让智能体具备审查和优化自身输出的编码能力。

Duvall 还探讨了规范驱动开发等方法是怎样让现有软件工程实践不断演进的。他的代码库中包含适用于 AWS IAM 策略生成场景的智能体可读规范示例,通过预先定义预期行为、约束条件与验收标准,让智能体能够依据清晰的规范生成并校验输出。在谈及经典的测试优先模式如何被用来指导 AI 辅助工作流时,他表示:

我其实……是在复用我们在敏捷开发和极限编程(XP)中的做法……说白了就是先红、再绿、再重构……我就是按这个流程在做。

Duvall 还指出了智能体生命周期初期阶段存在的挑战,尤其是在意图定义环节。他发现,尽管 AI 工具能够快速生成代码,但模糊、不明确的输入往往会导致结果不一致且难以预测。这也使得人们更加重视通过更清晰的规范来驱动智能体,包括使用包含角色、上下文与约束的结构化提示词来描述意图,以及采用规范驱动开发和基于行为定义的验收测试。他表示:“如果没有完整地描述清楚意图,就只会得到随机的结果。”

在近期的 DevSecOps Talks 播客中,System Initiative 产品总监 Paul Stack 也谈到了对更清晰规范的重视。他主导开发的 SWAMP 是一个用于自动化与验证基础设施的开源智能体平台。Stack 介绍了自己如何围绕智能体重构开发流程,甚至放弃拉取请求,转而采用基于 GitHub Issue 的工作流,并融入规范驱动开发模式。他表示:

我们不接受拉取请求……如果你有设计方案,请提交一个 Issue,我们会进行交互式的合作,一起完善、共同设计。

Scott Hanselman 的播客中,“The Pragmatic Engineer” 新闻组作者 Gergely Orosz介绍 了一个开源项目:该项目不合并拉取请求,而是采用 “remixing” 模式,由智能体按照项目标准重构提交的 PR。Hanselman 认为,尽管架构与设计“品味”对系统来说至关重要,但“拥有无限耐心的初级工程师”这种心态很适合用来处理繁琐重复性的工作,这与完全自动化的“Ralph 循环”自主智能体形成对比——这类智能体通过子智能体迭代优化方案,直至满足需求。

Stack 还强调必须提供准确的架构模式与实践规范,让智能体能够“以与代码库一致的方式生成代码”,以及预先定义架构、约束条件与测试预期。与 InfoQ 报道的 Boris Cherny 智能体工作流 类似,Stack 表示他也会使用 Claude 的“计划模式”在执行前对意图进行审查,以此来避免出现“AI 恐怖故事”式的问题。

Duvall 还指出了右移实践(Shifting-Right)的重要性,主张将这类反馈循环延伸至生产环境。他阐述了如何利用可观测性、遥测数据乃至生产环境中的测试来缩短反馈周期,解析实时信号并回送至开发生命周期。展望未来,他认为 AI 可能催生出规模更小、目标更聚焦的团队,并提到随着协调成本降低、自动化程度提升,研发团队将向“单披萨团队”(One-Pizza Team)模式转型。

Duvall 认为,与以往的工程变革一样,质量保障将越来越依赖自动化,而非人工审查。他表示:

你正在搭建相应机制……让代码得到审查……只不过未必每次都由你亲自审查。

Duvall 与 Stack 均强调,AI 辅助开发需要结合左移实践与右移反馈,将行为定义与生产状态纳入验证流程。Duvall 还指出,AI 能够更全面地分析生产遥测数据,从而识别出模式、更早地发现问题。

Duvall 的代码库在持续更新中,其中定义了涵盖开发、安全与运维场景的结构化模式及成熟度等级。这些模式包括 规范驱动开发、编码规则 和 架构约束、原子分解 与 并行智能体,以及具备 自动化可追溯性 的 可观测开发。

Orosz 意识到开发正在向以代码为中心之外的方向转变,他认为工程的定位与实践将会提升到新层次,超越代码本身。他表示:

我认为,除了编写代码之外,还有一些特质会让我们与众不同,我们理应去培养这种能力。

查看英文原文:

https://www.infoq.com/news/2026/03/agentic-engineering-patterns/

声明:本文由 InfoQ 翻译,未经许可禁止转载。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

今日荐文

图片
你也「在看」吗?👇

在AI辅助开发的背景下,规范的制定和维护需要更加注重可读性和可执行性。规范应该采用结构化的形式,例如使用包含角色、上下文与约束的结构化提示词,以便AI能够理解和执行。同时,规范还需要不断演进,根据实际情况进行调整和完善。可以考虑建立一个共享的规范库,让所有团队成员都可以参与到规范的制定和维护中来。

制定规范就像给AI画了个框,告诉它什么能做,什么不能做。但是,这个框不能画得太死,否则AI就没法发挥它的创造力了。所以,规范应该具有一定的灵活性,允许AI在一定范围内自由发挥。另外,规范也需要与时俱进,随着技术的变化不断更新,否则就可能成为AI发展的绊脚石。

理想情况下,自动化负责效率,人工负责质量和创新。初期可以更多地依靠人工审查来建立信任,随着自动化测试体系的完善,逐步减少人工审查的比例。但完全取消人工审查是不现实的,因为AI再智能,也无法完全理解人类的需求和意图。

完全依赖自动化?除非你对bug零容忍!我觉得自动化测试更像是警察巡逻,能抓到一些明显的违规行为,但对于一些隐藏的犯罪,还得靠侦探(人工审查)来破案。所以,最佳方案是自动化和人工相结合,就像警犬和警察一样,互相配合,才能维护代码的安全。

单披萨团队?感觉很像特种部队啊!不过问题也来了,这种模式是不是意味着对成员的要求会非常高,压力也会很大?还有,如果团队成员之间出现矛盾,这么小的团队会不会更容易崩盘?而且我觉得这种模式可能更适合创新型项目,对于需要长期维护的传统项目,可能不太适用。

重要性五颗星!没有规范,AI就是脱缰的野马。不过,别把规范想得太死板,它应该是一个活的、可演进的系统。一方面,要尽可能地自动化规范的检查和执行,另一方面,要鼓励开发者参与规范的制定和反馈,形成一个良性循环。可以考虑借鉴一些DDD(领域驱动设计)的思想,让规范更好地反映业务的真实需求。

不好说好坏,就像开车从手动挡变成自动挡一样,是技术进步,但同时也丧失了一些控制感。我个人还是喜欢“老司机”式的逐行审查,虽然慢,但心里踏实。不过,在AI时代,也许我们真的需要重新定义“好代码”的标准了,也许更重要的是快速迭代和试错,而不是追求完美无缺。

规范驱动开发绝对是未来AI辅助开发的核心!你想,AI再聪明,也得有个明确的指令才能干活。规范就是这个指令,它告诉AI应该做什么,不应该做什么。如何定义和维护这些规范?我认为应该从两个方面入手:一是规范本身要足够清晰、明确,最好是机器可读的;二是建立一套持续迭代和改进规范的机制,让规范能够随着业务发展和技术进步不断演进。要不然,AI只能学会按照过时的“规矩”办事。

我觉得这既是必然也是挑战。AI 提速了生产,逐行审查肯定跟不上。但问题在于,放弃细致的审查,如何保证代码的质量和安全性?自动化测试和智能体防护是关键,但目前来看,这些手段是否真的足够可靠,还需要实践检验。我个人会倾向于自动化审查为主,人工抽查关键部分为辅的方式,毕竟人的经验和直觉在很多时候还是不可替代的。