读取变更集
区分被改代码、现有测试和覆盖缺口。
上下文分诊质量工程 Demo
一个测试生成 Agent:根据 diff 制定测试计划,生成可运行测试,用 critic 检查稳定性,并记录进度。

可点、可跑、可观察
这个模拟器不替代命令行运行,但可以直接在网页里观察每一步的状态、执行日志、质量门和最终输出。
区分被改代码、现有测试和覆盖缺口。
上下文分诊把 diff 转成边界、回归和反例测试。
规划-执行按计划生成 pytest 风格测试代码。
工具分派检查确定性、断言和 fixture 风格。
生成器-评论家机械失败时进行一次有界修复。
自愈循环记录已生成用例,避免重复劳动。
进度跟踪
| 模式 | 设计作用 |
|---|---|
| 规划-执行 | 生成测试前需要明确测试计划。 |
| 生成器-评论家 | 测试代码必须由独立角色检查。 |
| 自愈循环 | 有界修复处理机械失败,但不掩盖业务歧义。 |
| 进度跟踪 | Agent 要记住跨 PR 的覆盖进展。 |
不能运行的测试是负资产。
最好的 critic 绑定 import、断言、fixture 和测试结果。
没有 progress tracking,同一批用例会被一遍遍生成。
cd workshops/workshop2-test-generation
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python src/main.py
open visual/index.htmlworkshops/workshop2-test-generation/README.mdimages/training/visual/workshop2-test-generation-blueprint.png