接入告警
明确事故时间窗和服务边界。
上下文分诊质量工程 Demo
一个故障诊断 Agent:从日志、指标、部署和配置中收集证据,再通过可证伪假设逐步收敛。

可点、可跑、可观察
这个模拟器不替代命令行运行,但可以直接在网页里观察每一步的状态、执行日志、质量门和最终输出。
明确事故时间窗和服务边界。
上下文分诊并行读取日志、指标、部署事件和配置。
扇出/汇聚把异构证据规范成同一条时间线。
多模态融合提出最可能根因和验证动作。
迭代假设拒绝弱假设,收敛到证据支持的原因。
迭代假设输出时间线、置信度、下一步和未解风险。
可观测性 Harness
| 模式 | 设计作用 |
|---|---|
| 扇出/汇聚 | 事故证据分散在多个系统,可并行查询。 |
| 多模态融合 | 日志、指标和配置要变成一条可比较时间线。 |
| 迭代假设 | Agent 要测试并拒绝假设,而不只是复述症状。 |
| 可观测性 Harness | 每个诊断都要有轨迹、置信度和未解风险。 |
更多日志本身没有意义,除非 Agent 有假设循环。
诊断 Agent 不执行修复,只输出证据和下一步,也能很安全。
低置信度应该触发升级,而不是生成一段貌似自信的话。
cd workshops/workshop3-incident-diagnosis
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python src/main.py
open visual/index.htmlworkshops/workshop3-incident-diagnosis/README.mdimages/training/visual/workshop3-incident-diagnosis-blueprint.png