质量工程 Demo

智能测试生成 Agent

一个测试生成 Agent:根据 diff 制定测试计划,生成可运行测试,用 critic 检查稳定性,并记录进度。

可运行 demo · 仓库路径: workshops/workshop2-test-generation

结构蓝图

智能测试生成 Agent blueprint

可点、可跑、可观察

交互式浏览器 Demo

这个模拟器不替代命令行运行,但可以直接在网页里观察每一步的状态、执行日志、质量门和最终输出。

实时流水线

状态检查器

执行日志

当前输出

一步一步看设计

01

读取变更集

区分被改代码、现有测试和覆盖缺口。

上下文分诊
02

规划用例

把 diff 转成边界、回归和反例测试。

规划-执行
03

生成测试

按计划生成 pytest 风格测试代码。

工具分派
04

Critic 评审

检查确定性、断言和 fixture 风格。

生成器-评论家
05

运行验证

机械失败时进行一次有界修复。

自愈循环
06

记录进度

记录已生成用例,避免重复劳动。

进度跟踪

截图

命令行输出:测试计划、生成用例、评审通过和进度记录。
命令行输出:测试计划、生成用例、评审通过和进度记录。

模式映射

模式设计作用
规划-执行生成测试前需要明确测试计划。
生成器-评论家测试代码必须由独立角色检查。
自愈循环有界修复处理机械失败,但不掩盖业务歧义。
进度跟踪Agent 要记住跨 PR 的覆盖进展。

设计洞察

可运行优先于看起来合理

不能运行的测试是负资产。

Critic 要有确定性依据

最好的 critic 绑定 import、断言、fixture 和测试结果。

进度记录防止反复横跳

没有 progress tracking,同一批用例会被一遍遍生成。

运行路径

cd workshops/workshop2-test-generation python3 -m venv .venv source .venv/bin/activate pip install -r requirements.txt python src/main.py open visual/index.html
READMEworkshops/workshop2-test-generation/README.md
Blueprintimages/training/visual/workshop2-test-generation-blueprint.png