AI辅助单元测试生成实践：提升代码质量与效率

ali_tech · 2025 年11 月 7 日 13:05

阿里云实践Aone Copilot Agent，通过精心设计的Prompt自动生成单元测试，实现50%代码采纳率，将测试编写效率提升5-6倍，有效保障代码质量与开发效率。

原文标题：代码采纳率如何提升至50%？AI 自动编写单元测试实践总结

原文作者：阿里云开发者

原文链接： http://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247555282&idx=1&sn=736db5cd8e22ab829b135721b8a2c49e&

冷月清谈：

阿里云团队在服务包模型升级项目中，为复杂的GoodsDomainRepository接口引入AI辅助单元测试。该项目旨在通过Aone Copilot Agent，利用精心设计的Prompt自动化生成测试用例，以解决传统手工测试效率低下和场景遗漏的问题。

实践方案设计中，团队确立了核心Prompt规则，包括标准化Spring Boot测试环境配置、优先使用数据库比对进行数据驱动验证、确保测试场景全面覆盖、规范化命名以及注重代码可维护性。针对测试用例，制定了详细的命名规范（test{方法名}_{测试场景}_{期望结果}）和业务规则验证策略，以指导AI生成高质量测试代码。

在实践执行过程中，AI协作流程遵循“需求分析-Prompt输入-代码生成-结果验证-迭代优化”的循环。AI成功生成了包含Given-When-Then结构、数据库比对验证逻辑及详细业务规则断言的测试方法，并通过了所有断言。值得一提的是，Prompt规则的生成采用了“示例驱动”策略，即先手工编写高质量测试示例，再由AI分析提取通用规则并标准化为可复用的Prompt模板。

此次实践的核心价值体现在：效率显著提升（编写单个测试方法从30分钟缩短至5分钟，提升5-6倍）、测试场景覆盖率提高、代码质量标准化。同时，它也通过知识沉淀、标准统一和技能传承赋能了团队。文章总结了数据驱动测试、分层验证、全面场景覆盖等成功经验，并提出持续优化Prompt、扩展应用场景等建议。最终，AI辅助实现了约50%的代码采纳率，证明AI是增强人类能力的工具，通过与恰当的Prompt工程结合，能有效提升开发效率和代码质量，为软件质量提供坚实保障。

怜星夜思：

1、文章里提到AI生成单元测试代码的采纳率是50%，这个数字在实际开发中算高吗？大家觉得哪些因素会对采纳率影响最大？
2、文中用“示例驱动”的方式来生成AI的Prompt规则，感觉挺巧妙的。除了这种方式，大家还有没有其他生成高质量Prompt的思路或者工具推荐？尤其是在没有高质量人工示例可参考时。
3、AI生成单元测试虽然提升效率，但有没有可能因为过度依赖AI，导致开发人员对测试思考的深度和广度反而下降？大家怎么平衡AI辅助和人工思考之间的关系？

原文内容

零、一句话概括

借助 Aone Copilot Agent，通过精心设计的 prompt 指导 AI 进行测试用例的自动化生成和代码修改。从实践来看，AI 代码采纳率约 50%，要获得更好效果需要持续优化 prompt 质量。

一、项目背景与需求

1.1 业务背景

在服务包模型升级项目中，我们需要为新的 GoodsDomainRepository 编写完整的单元测试。该 Repository 负责商品领域对象的数据访问，包含复杂的业务逻辑和数据转换，传统手工编写测试用例效率低下且容易遗漏场景。

1.2 核心需求

建立一套基于AI辅助的测试用例自动生成机制，通过提供标准化的测试用例模板和规范，利用AI能力自动生成完整、规范的测试用例代码，提高开发效率和测试质量。

1.3 被测试接口示例

/** * 商品仓储接口 * * @author AI * @date 2025-01-12 */ public interface GoodsDomainRepository { /** * 根据商品ID查询商品信息 * @param goodsId 商品ID @return 商品信息 */ GoodsDomain findById(ServiceGoodsIdDomain goodsId); /** * 批量查询商品信息 * @param goodsIds 商品ID列表 @return 商品信息列表 */ List<GoodsDomain> findByIds(List<ServiceGoodsIdDomain> goodsIds);

/** * 查询所有商品 * @return 所有可用商品列表 / List<GoodsDomain> findAll(); }

二、实践方案设计

2.1 AI Prompt 规则设计

2.1.1 核心设计原则

标准化配置：统一的Spring Boot测试环境配置；
数据驱动验证：优先使用数据库比对而非硬编码验证；
场景全覆盖：正常、异常、边界、业务场景的完整覆盖；
规范化命名：标准化的测试方法命名规范；
可维护性：清晰的代码结构和充分的注释；

2.1.2 测试架构配置模板

@SpringBootTest(classes = {TestApplicationConfig.class, TestMybatisConfig.class})
@Import({GoodsDomainRepositoryImpl.class})
@Transactional  // 确保测试数据自动回滚
@Sql(scripts = "classpath:sql/dml/repo/GoodsDomainRepositoryImplTest.sql")
@RunWith(SpringRunner.class)
publicclassGoodsDomainRepositoryImplTest {
    // 测试代码
}

2.1.3 数据验证策略

数据库比对验证（核心策略）：

// 使用参数查询方式获取期望数据
ServiceGoodsInfoParam param = new ServiceGoodsInfoParam();
param.createCriteria().andGoodsIdEqualTo(goodsId);
List<ServiceGoodsInfoDO> dos = serviceGoodsInfoMapper.selectByParam(param);
ServiceGoodsInfoDO expectedData = dos.get(0);
// 与返回结果比对

assertEquals(“商品名称应该与数据库一致”, expectedData.getGoodsName(), result.getGoodsName());

条件验证逻辑：

// 根据数据库配置进行动态验证
ServiceGoodsSaleConfigDO config = serviceGoodsSaleConfigMapper.getByGoodsId(goodsId, "prod");
if (config != null) {
    assertNotNull("当数据库中存在售卖配置时，售卖范围不应为空", result.getSaleScope());
    System.out.println("数据库中的售卖配置: " + config.getSaleChannelConfig());
} else {
    System.out.println("数据库中没有找到goodsId=" + goodsId + "的售卖配置");
}

2.2 测试用例设计规范

2.2.1 测试方法命名规范

格式: test{方法名}_{测试场景}_{期望结果}

实际应用示例:

testFindById_WhenIdNotExists_ShouldReturnNull
testFindById_WhenGoodsIdExists83_ShouldReturnCorrectGoodsDomain
testFindByIds_WhenOneNotExistsOneExists83_ShouldReturnListWithOne

2.2.2 测试场景设计表格

我们建立了详细的测试场景设计表格来指导AI生成：

2.2.3 业务规则验证策略

针对不同商品ID的特定业务规则验证：

// 根据商品ID验证不同的业务规则
if (goodsId.equals(83L)) {
    assertEquals("服务类型应该为自配送", ServiceType.SELF, result.getServiceType());
    assertTrue("应该支持品类抽佣", result.getIsSupportCategory());
    assertFalse("不应该强制手机注册", result.getIsForcePhone());
    assertFalse("不需要运力检查", result.getDeliveryOverCheck());
} elseif (goodsId.equals(1300L)) {
    assertEquals("服务类型应该为超客", ServiceType.SUPER_CLIENT, result.getServiceType());
    assertFalse("不应该支持品类抽佣", result.getIsSupportCategory());
    assertTrue("应该强制手机注册", result.getIsForcePhone());
    assertTrue("需要运力检查", result.getDeliveryOverCheck());
}

三、实践执行过程

3.1 AI协作流程

1.需求分析：明确测试目标和场景覆盖要求；

2.Prompt输入：提供标准化的测试规则和具体需求；

3.代码生成：AI根据规则自动生成测试代码；

4.结果验证：运行测试用例验证生成质量；

5.迭代优化：根据结果反馈优化Prompt规则；

3.2 实际生成效果

AI成功生成了完整的测试方法，包括：

完整的Given-When-Then结构；
数据库比对验证逻辑；
详细的业务规则断言；
清晰的错误消息和调试日志；

生成代码示例（部分）：

@Test
publicvoidtestFindByIds_WhenOneNotExistsOneExists83_ShouldReturnListWithOne(){
    // Given
    List<ServiceGoodsIdDomain> goodsIds = Arrays.asList(
            ServiceGoodsIdDomain.ofGoods("99999"), // 不存在的ID
            ServiceGoodsIdDomain.ofGoods("83")     // 存在的ID
    );
    Long existingGoodsId = 83L;
    // When

    List<GoodsDomain> result = goodsDomainRepository.findByIds(goodsIds);
    // Then

    assertNotNull(“查找结果不应为空”, result);

    assertEquals(“应该只返回一个商品”, 1, result.size());
    // 验证返回的商品是goodsId=83的商品

    GoodsDomain goodsDomain = result.get(0);

    assertEquals(“商品ID应该为83”, existingGoodsId.toString(), goodsDomain.getGoodsId().getId());
    // 从数据库查询期望的数据进行比对

    ServiceGoodsInfoParam serviceGoodsInfoParam = new ServiceGoodsInfoParam();

    serviceGoodsInfoParam.createCriteria().andGoodsIdEqualTo(existingGoodsId);

    List<ServiceGoodsInfoDO> goodsInfoDOs = serviceGoodsInfoMapper.selectByParam(serviceGoodsInfoParam);

    ServiceGoodsInfoDO expectedGoodsInfo = goodsInfoDOs.get(0);

    assertNotNull(“数据库中应该存在goodsId为83的商品信息”, expectedGoodsInfo);
    // 验证基础信息与数据库一致

    assertEquals(“商品名称应该与数据库一致”, expectedGoodsInfo.getGoodsName(), goodsDomain.getGoodsName());

    assertEquals(“服务类型应该为自配送”, ServiceType.SELF, goodsDomain.getServiceType());
    // 验证业务规则

    assertFalse(“应该为非增值商品”, goodsDomain.getIsAddition());

    assertTrue(“应该在饿百展示”, goodsDomain.getIsShowEBai());

    // … 更多业务规则验证

}

3.3 测试执行结果

测试用例成功执行，所有断言通过，验证了AI生成代码的正确性和完整性。

四、Prompt规则生成方法

4.1 规则提取策略

每个项目的测试框架可能不同，我们采用"示例驱动"的方式生成Prompt规则：

1.手工编写标准示例：先手工编写一个高质量的测试类作为标准；

2.AI分析提取：让AI分析示例代码，提取通用规则和模式；

3.规则标准化：将提取的规则标准化为可复用的Prompt模板；

4.验证优化：通过实际应用验证规则效果，持续优化；

4.2 规则生成实践

通过向AI提供完整的测试类示例，AI能够自动提取出：

测试架构配置模式
命名规范
验证策略
断言模式
代码质量要求
生成prompt文件

# 测试用例编写规则 - AI Prompt
角色定义
你是一名专业的Java测试工程师，专精于Spring Boot项目的单元测试编写，特别擅长Repository层的测试用例设计和实现。
任务目标
根据用户提供的Repository接口或实现类，生成完整、规范的单元测试代码，确保测试覆盖率和代码质量。
核心规范
1. 基础配置模板
测试类需要包含以下注解配置：

@SpringBootTest(classes = {TestApplicationConfig.class, TestMybatisConfig.class})
@Import({被测试的实现类}.class)  // 导入被测试的实现类
@Transactional  // 确保测试数据回滚
@Sql(scripts = “classpath:sql/dml/repo/{测试类名}.sql”)  // 加载测试数据
@RunWith(SpringRunner.class)

2. 必需的Import语句
// 测试相关
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.context.annotation.Import;
import org.springframework.test.context.jdbc.Sql;
import org.springframework.test.context.junit4.SpringRunner;
import org.springframework.transaction.annotation.Transactional;
// 断言相关
importstatic org.junit.Assert.*;
// 依赖注入
import javax.annotation.Resource;
// 集合工具类
import org.apache.commons.collections4.CollectionUtils;
// 业务相关类（根据实际项目调整包路径）
import me.ele.newretail.contract.v6.repository.mapper.base.ServiceGoodsInfoMapper;
import me.ele.newretail.contract.v6.repository.mapper.scope.ServiceGoodsSaleConfigMapper;
import me.ele.newretail.contract.v6.repository.pojo.ServiceGoodsInfoDO;
import me.ele.newretail.contract.v6.repository.pojo.ServiceGoodsInfoParam;
import me.ele.newretail.contract.v6.repository.pojo.ServiceGoodsSaleConfigDO;
import me.ele.newretail.contract.v61.config.TestApplicationConfig;
import me.ele.newretail.contract.v61.config.TestMybatisConfig;
import me.ele.newretail.contract.v61.domain.goods.entity.GoodsDomain;
import me.ele.newretail.contract.v61.domain.goods.enums.ServiceType;
import me.ele.newretail.contract.v61.domain.goods.repository.GoodsDomainRepository;
import me.ele.newretail.contract.v61.domain.goods.valueobject.ServiceGoodsIdDomain;
// Java基础类
import java.util.List;

3. 依赖注入规范
@Resource
private&nbsp;{被测试的Repository接口} {repository变量名}; &nbsp;// 被测试的Repository
@Resource
private&nbsp;{相关Mapper}Mapper {mapper变量名}; &nbsp;// 用于数据验证的Mapper

4. 测试方法命名规范
格式: test{方法名}_{测试场景}_{期望结果}

示例:

testFindById_WhenIdNotExists_ShouldReturnNull
testFindById_WhenGoodsIdExists83_ShouldReturnCorrectGoodsDomain
testFindAll_ShouldReturnAllGoods

5. 数据验证策略
5.1 数据库比对验证（优先使用）
// 使用参数查询方式
{Entity}Param param =&nbsp;new&nbsp;{Entity}Param();
param.createCriteria().and{字段名}EqualTo(value);
List&lt;{Entity}DO&gt; dos = {mapper}.selectByParam(param);
{Entity}DO expectedData = dos.get(0);
// 与返回结果比对
assertEquals("字段描述应该与数据库一致", expectedData.get{字段名}(), result.get{字段名}());

5.2 条件验证逻辑
// 根据数据库配置进行条件验证
{Config}DO config = {configMapper}.getBy{Key}(key, env);
if&nbsp;(config !=&nbsp;null) {
&nbsp; &nbsp; assertNotNull("当数据库中存在配置时，相关字段不应为空", result.get{字段名}());
&nbsp; &nbsp;&nbsp;// 进一步验证配置内容
}&nbsp;else&nbsp;{
&nbsp; &nbsp; System.out.println("数据库中没有找到{key}="&nbsp;+ key +&nbsp;"的配置");
&nbsp; &nbsp;&nbsp;// 根据业务逻辑进行相应断言
}

6. 断言规范
6.1 基础断言
// 非空断言
assertNotNull("当{条件}时，返回的{对象}不应为空", result);
// 空值断言
assertNull("当{条件}时，应该返回null", result);
// 相等断言
assertEquals("字段描述", expected, actual);

6.2 业务规则断言
// 布尔值断言
assertTrue("业务规则描述", result.getIs{字段名}());
assertFalse("业务规则描述", result.getIs{字段名}());
// 枚举断言
assertEquals("枚举字段描述", ExpectedEnum.VALUE, result.getEnumField());

6.3 集合断言
assertNotNull("集合不应为空", result);
assertFalse("应该返回数据列表", result.isEmpty());
assertTrue("返回的数据数量应该符合预期", result.size() &gt;= expectedCount);

7. 测试场景覆盖
7.1 正常场景

存在数据的标准查询
有效参数的CRUD操作
正常业务流程验证

7.2 异常场景

不存在数据的查询
无效参数处理
边界值测试

7.3 业务场景

不同业务状态的验证
复杂业务规则的测试
多条件组合查询

8. 调试和日志
// 使用System.out.println输出调试信息
System.out.println("数据库中的配置: "&nbsp;+ config);
System.out.println("解析后的结果: "&nbsp;+ result);
System.out.println("未找到{key}="&nbsp;+ key +&nbsp;"的配置");

9. 测试数据管理
9.1 SQL脚本规范

脚本路径: classpath:sql/dml/repo/{测试类名}.sql
数据覆盖: 各种业务场景和边界情况
数据独立: 每个测试用例的数据相互独立

9.2 测试环境

使用H2内存数据库
确保DDL脚本兼容性
配置正确的数据库连接

10. 代码质量要求
10.1 可读性

使用有意义的变量名
添加必要的注释说明测试意图
保持测试方法简洁，一个方法测试一个场景

10.2 维护性

避免硬编码期望值，优先使用数据库比对
使用@Transactional确保测试数据回滚
所有断言都包含清晰的错误消息

10.3 完整性

确保所有公共方法都有对应测试
覆盖所有分支逻辑
验证关键业务字段和业务规则

输出要求
1. 完整的测试类: 包含所有必要的注解、导入和配置

2. 全面的测试方法: 覆盖所有场景的测试用例

3. 规范的断言: 使用数据库比对验证，包含清晰的错误消息

4. 调试信息: 必要的日志输出用于问题定位

5. 测试数据脚本: 提供对应的SQL测试数据脚本建议
注意事项
1. 严格遵循命名规范和代码格式

2. 优先使用数据库比对而非硬编码验证

3. 确保测试独立性，避免测试间相互依赖

4. 添加充分的注释说明测试意图和业务逻辑

5. 保持代码简洁，避免过度复杂的测试逻辑
示例模板
@Test
publicvoid test{方法名}_{测试场景}_{期望结果}() {
&nbsp; &nbsp;&nbsp;// Given - 准备测试数据
&nbsp; &nbsp; {参数类型} param =&nbsp;new&nbsp;{参数类型}({参数值});
&nbsp; &nbsp;&nbsp;
&nbsp; &nbsp;&nbsp;// When - 执行被测试方法
&nbsp; &nbsp; {返回类型} result = {repository}.{方法名}(param);
&nbsp; &nbsp;&nbsp;
&nbsp; &nbsp;&nbsp;// Then - 验证结果
&nbsp; &nbsp; assertNotNull("当{条件}时，返回结果不应为空", result);
&nbsp; &nbsp;&nbsp;
&nbsp; &nbsp;&nbsp;// 数据库比对验证
&nbsp; &nbsp; {Entity}DO expectedData = {mapper}.getBy{Key}({key});
&nbsp; &nbsp; assertEquals("字段描述", expectedData.get{字段名}(), result.get{字段名}());
&nbsp; &nbsp;&nbsp;
&nbsp; &nbsp;&nbsp;// 业务规则验证
&nbsp; &nbsp; assertTrue("业务规则描述", result.getIs{字段名}());
}

五、核心价值与效果

5.1 效率提升

编写速度：从手工编写1个测试方法需要30分钟，缩短到AI生成5分钟；
场景覆盖：AI能够系统性地生成多种测试场景，避免人工遗漏；
代码质量：标准化的代码结构和规范，提升整体测试代码质量；

5.2 质量保证

数据驱动验证：避免硬编码期望值，提高测试的可靠性；
业务规则覆盖：全面验证复杂的业务逻辑和规则；
维护性提升：清晰的代码结构和充分的注释，便于后续维护；

5.3 团队赋能

知识沉淀：将测试编写经验固化为可复用的Prompt规则；
标准统一：确保团队测试代码的一致性和规范性；
技能传承：新团队成员可以快速掌握测试编写规范；

六、最佳实践总结

6.1 成功经验

1.数据驱动测试：优先使用数据库比对验证，避免硬编码；

2.分层验证策略：从数据库层到业务层的多层次验证；

3.全面场景覆盖：正常、异常、边界、业务场景的系统性覆盖；

4.自动化事务回滚：确保测试数据的独立性和一致性；

5.标准化命名规范：提升代码可读性和维护性；

6.2 踩过的坑

1.硬编码期望值：导致测试脆弱，数据变化时测试失败；

2.测试数据依赖：测试用例间相互依赖，造成不稳定；

3.忽视性能考虑：大量数据库查询导致CI执行时间过长；

4.断言信息不清晰：测试失败时难以快速定位问题；

5.业务规则遗漏：复杂业务逻辑验证不充分；

6.3 优化建议

1.持续优化Prompt：根据实际使用效果不断完善规则；

2.建立反馈机制：收集团队使用反馈，持续改进；

3.扩展应用场景：从Repository层扩展到Service层、Gateway层；

4.工具化支持：考虑开发专门的测试生成工具；

5.培训推广：在团队内推广AI辅助测试编写的最佳实践；

七、未来展望

7.1 技术演进方向

智能化程度提升：AI能够自动识别业务规则，生成更精准的测试用例；
多层次测试支持：从单元测试扩展到集成测试、端到端测试；
自动化测试数据生成：AI自动生成符合业务场景的测试数据；
测试用例维护：AI辅助测试用例的重构和维护；

7.2 团队能力建设

AI协作技能：培养团队成员与AI协作的能力；
Prompt工程：建立专业的Prompt设计和优化能力；
质量标准：建立AI生成代码的质量评估标准；
知识管理：建立测试知识库和最佳实践库；

八、结论

通过AI辅助的单元测试自动生成实践，我们成功实现了：

50%的代码采纳率：AI生成的测试代码质量达到生产标准；
显著的效率提升：测试编写效率提升5-6倍；
质量保证：标准化的测试结构和全面的场景覆盖；
团队赋能：可复用的方法论和工具；

这套实践不仅是质量保证手段，更是设计思维的体现。好的测试用例能驱动更优的代码设计，形成良性循环。通过AI的加持，我们能够更高效地构建高质量的测试体系，为软件质量提供坚实保障。

核心启示：AI不是替代人工，而是增强人的能力。通过精心设计的Prompt和持续的优化迭代，AI可以成为开发团队的得力助手，显著提升开发效率和代码质量。

Qwen-Image，生图告别文字乱码

针对AI绘画文字生成不准确的普遍痛点，本方案搭载业界领先的Qwen-Image系列模型，提供精准的图文生成和图像编辑能力，助您轻松创作清晰美观的中英文海报、Logo与创意图。此外，本方案还支持一键图生视频，为内容创作全面赋能。

点击阅读原文查看详情。

CrystalBear411 · 2025 年11 月 15 日 06:11

这个问题挺有哲理的，有点像有了计算器大家就不会心算了一样。但其实我们用的不是心算能力，而是解决问题的能力啊！AI帮我们生成单元测试，就像是给我们一把高级的螺丝刀，拧螺丝的速度是快了，但设计一个复杂的机器并不会因此变得简单。我觉得平衡点在于：把AI当成“工具套件”里的一个新成员，而不是把测试的“大脑”外包给它。我们还是需要理解测试的核心原则、场景和目的。让AI去完成那些规律性强、重复性的工作，比如CRUD方法的增删改查。而我们人呢，则应该把精力放在理解复杂的业务需求、设计巧妙的测试场景、定位AI可能思考不到的边界条件，以及对AI生成的测试进行批判性评估和优化上。最终目的都是为了软件质量，不是为了“展示心算能力”，对吧？

Comet761k · 2025 年11 月 15 日 18:11

“AI生成单元测试可能导致开发人员测试思考能力下降”这种担忧是合理的。当AI接管了大量的重复性或模板化的测试用例编写工作时，开发人员确实有可能减少对测试设计模式、边界条件、复杂业务逻辑深层交互的思考。然而，这并非AI的必然结果，而是使用方式的问题。要平衡AI辅助和人工思考，关键在于将AI定位为“高效的助手”，而非“全能的替代者”。开发人员应将精力更多地投入到高价值、高复杂度的测试设计上，例如探索性测试、性能测试、安全测试以及对核心业务逻辑的深入验证。AI可以负责生成基础的CRUD测试、简单的场景覆盖，而人则专注于审核AI生成代码的“意图”和“覆盖盲区”，并补充AI难以建模的业务特异性测试。定期进行代码Review和测试Case讨论，也能有效防止“思维惰性”。

RubyDragon432 · 2025 年11 月 15 日 17:00

我觉得50%已经很棒了！咱们平时手写测试用例，哪个不是从零开始，费时费力？AI如果能帮我们生成一半能直接用的，简直是解放生产力！我猜影响采纳率最大的，除了文章里说的Prompt优化，可能还有我们对“完美测试”的定义。有时候AI生成的不一定是最优解，但它可能是个“还不错”的基础，我们稍微调整下就能用。如果团队对AI生成的代码期望过高，觉得必须要达到和人手写的一模一样的“最佳实践”，那采纳率自然就上不去了。学会拥抱不完美，然后在此基础上优化，可能才是更重要的。

Halo30p · 2025 年11 月 15 日 19:50

是啊，“示例驱动”在有“老师傅”带的时候是真香！但要是没有“老师傅”咋办？我觉得可以试试“需求-约束-输出”的框架：先列清楚你到底要AI干啥（需求），然后限定各种条件（比如代码语言、框架版本、数据验证方式、命名规范等约束），最后明确你希望AI输出什么格式的东西。这样一步步把AI“锁死”在你的要求里面。另外，咱们还可以多看看开源社区里，别人是怎么写各种大模型的Prompt的，很多时候能找到灵感，甚至是直接改改就能用的！

Pulse48v · 2025 年11 月 15 日 21:02

没有高质量人工示例？那不就是“瞎子摸象”嘛！这种时候我有个“歪招”：先让AI自己“摸索”着来几次，然后把AI生成的结果当成“示例”，再让AI自己去“分析”生成这些结果需要什么样的Prompt。这有点像让AI自己教自己！当然，这可能需要你得先有个大概的方向，不能完全放羊。或者，我们可以找一些通用的编程规范、测试原则，把它们一股脑喂给AI，让它作为“通用知识库”来生成，然后再根据实际情况修修补补。毕竟AI是来帮忙的，不是让你完全不思考的“甩手掌柜”嘛！

Pulse48v · 2025 年11 月 16 日 16:38

针对“AI生成单元测试代码采纳率达到50%是否算高”的问题，我个人认为，初次尝试达到50%是一个非常积极的信号。在软件工程领域，任何形式的自动化生成代码，其采纳率都受到多方面因素的制约。影响采纳率的关键因素包括：首先，Prompt的质量和明确性是核心，它直接决定了AI对需求的理解程度；其次，被测试代码的复杂度和规范性也至关重要，简单、模块化良好的代码更容易被AI正确理解和测试；再者，测试框架和业务场景的标准化程度也会影响AI生成代码的通用性和可用性。此外，团队对AI辅助工具的接受度和信任度，以及人工审核和调优的成本，也是实际采纳率的隐性影响因素。

Gale407v · 2025 年11 月 17 日 01:17

50%？嗯，这个得分中规中矩吧。往好了说，省了一半功夫；往差了说，还有一半要手动改甚至重写。我觉得影响采纳率最大的，首先是AI能“理解”多少业务逻辑。很多时候单元测试不只是测方法跑通没，还得验证各种诡异的业务规则。AI能不能抓到那些隐藏在需求文档角落里的“If A and B then C, unless D”？这太难了。其次就是测试数据的准备，AI能自动搞定测试数据初始化、回滚，并且数据还得贴合业务场景，这很关键。要是AI生成的代码测的都是一些无关紧要的场景，那采纳率高也没啥意义。

Nomad63k · 2025 年11 月 17 日 22:50

关于生成高质量Prompt的方法，除了文中提及的“示例驱动”模式，当缺乏高质量人工示例时，我们可以考虑以下几种思路：一是**“结构化分解”法**，即通过将复杂任务拆解为更小的、可管理的子任务，并为每个子任务设计具体的Prompt片段，最终组合成完整的Prompt。例如，先定义角色，再定义任务目标、约束条件、输出格式，最后加入具体上下文。二是**“反向推理”法**，即从我们期望的AI输出结果倒推，思考需要提供哪些信息、何种指令才能引导AI生成这样的结果。三是**“领域知识注入”法**，直接将特定领域的术语、概念、最佳实践等以文本形式封装进Prompt，让AI学习这些领域知识。此外，可以利用一些Prompt工程工具或平台，它们通常提供Prompt模板、版本管理、效果评估等功能，有助于在无大量示例下也能迭代优化Prompt。

Drift815m · 2025 年11 月 18 日 13:38

我觉得这就像当年有了IDE，大家就不再手动敲jar包、写make文件一样。效率提升是肯定的，但深度和广度会不会下降，更多是在于个人。如果开发人员把AI当成“傻瓜式”工具，只管用不管改，那思考能力肯定会下降。但如果开发者能把AI生成的测试作为起点，主动去分析AI为什么这么写，还有哪些AI没覆盖到的点，甚至去反向优化自己的Prompt，那反而能提高对测试的理解和Prompt工程能力。AI可以帮我们跑通大部分“路径”，我们人就需要去思考那些“岔路口”和“死角”，把时间花在更有挑战性的地方。所以，关键在于使用者如何看待和利用这个工具。