learn
复制与消除:FRER 如何让故障不立刻打断关键流
从序列号、复制路径、重复帧识别和恢复窗口理解 802.1CB 的核心机制。
本节学习目标
- 理解 FRER 为什么要复制关键帧,并在接收侧消除重复。
- 知道序列号和恢复窗口如何帮助识别重复与乱序。
- 能区分可靠性连续性和时间确定性。
本章目录
解决什么问题
确定性网络不仅要在正常情况下准时,还要考虑故障。单条路径一旦中断,哪怕调度表再完美,关键流也无法到达。FRER 解决的是故障连续性:同一份关键数据走多条路径,只要至少一份到达,业务就可以继续。
接收侧不能把复制来的多份数据都交给上层,否则上层会看到重复消息。因此 FRER 还需要消除重复帧,保留一份有效数据。
背景与直觉
可以把 FRER 想成重要文件同时走两家快递。只要其中一家按时送到,收件人就能使用文件;另一家晚到时,收件人知道这是重复件,不再处理。序列号就像每份文件的编号,帮助收件人判断哪些副本属于同一份数据。
但快递路线必须真的独立。如果两家快递都走同一座桥,桥断了就一起失败。网络里的路径分离也是同样道理。
怎么解决
发送侧为关键帧添加序列信息,并在复制点把帧发往多条路径。网络中间可能经过不同 bridge,最终在消除点汇合。接收侧或中间消除点根据序列号判断重复帧,交付第一份或最合适的一份,丢弃后续重复。
恢复窗口用于处理乱序和延迟差异。如果窗口太小,晚到的合法帧可能被误判;窗口太大,状态开销和处理压力增加。本节的辅助实验可以观察路径故障概率、路径独立性和序列窗口对连续性的影响。
带来了什么新问题
FRER 消耗更多带宽,因为同一份关键数据会占用多条路径。它还可能增加调度复杂度:两条路径都要满足时间边界,否则复制只是提高到达概率,不保证准时。序列窗口、乱序处理和重复消除也需要设备资源。
另一个关键问题是共因故障。路径在逻辑上不同,不代表物理上独立。如果两条路径共享电源、线束、机柜或上游交换机,可靠性收益会被高估。
本节掌握标准
学完后,你应该能解释 FRER 的完整链路:发送侧复制,路径尽量分离,接收侧按序列号消除重复。你也应该能指出 FRER 的边界:它提高故障连续性,但复制后的每条路径仍然需要独立满足时间和资源约束。
frer
同一份关键帧走两条路,接收侧只留一份。
复制和消除解决连续性问题,但仍然需要确定性路径。
failure drill
准时之外,关键流量还要能扛故障。
调节路径失效率、路径独立性和序列窗口,观察复制与消除如何保护连续性。
FRER 双路径故障演练
教学估算连续性
94%
重复消除压力
29帧
FRER 提高连续性
路径越独立、序列窗口越合理,故障下至少一份关键帧到达的概率越高。
try it
动手调参数
机制拆解
- 1发送侧复制关键帧。
- 2不同路径提高故障下至少一份到达的概率。
- 3接收侧根据序列号消除重复帧。
engineering check