learn

故障注入设计：测试要覆盖你声称覆盖的故障

学习如何把 FRER、Qbv、Qcc 的故障模型转成断链、端口 down、设备重启、配置失败和恢复阶段的验证场景。

第九章：验证与进阶阅读工程闭环TSN Validation22 分钟

first read

先抓住结论

学习如何把 FRER、Qbv、Qcc 的故障模型转成断链、端口 down、设备重启、配置失败和恢复阶段的验证场景。

这节怎么读

先看学习目标和章节目录，再进入正文；后续核心概念会在这里直接暴露参数。

fault modelinjection pointrecovery phasecoverage

故障测试不能随便拔一根线就结束。你测试的故障必须对应设计里声称覆盖的故障。否则报告写的是单桥故障，测试却只断了非关键链路，结论就不成立。

本节解决故障注入设计问题：测试要覆盖你声称覆盖的故障。

消防演练如果只测试办公区撤离，却声称覆盖机房火灾，就不匹配。网络故障注入也是一样。故障模型和测试动作要一一对应。

可以按三阶段设计：故障前、故障中、恢复后。

故障类型可以包括断链、端口 down、桥设备重启、grandmaster 切换、配置下发失败、背景流量突发、FRER 主路径恢复等。

故障注入测试可能破坏业务，因此要明确测试环境、时间窗口和回滚方案。某些故障很难在生产中测试，就要在实验环境或仿真环境中补证据，并在报告中写清限制。

故障注入还会产生大量日志和抓包，需要提前规划采集点。故障发生的一瞬间往往最关键，事后再开抓包通常已经晚了。

读完本节后，先用下面这些问题校准自己，而不是只确认“看过了”。

next steps