返回学习路径

learn

复制与消除:FRER 如何让故障不立刻打断关键流

从序列号、复制路径、重复帧识别和恢复窗口理解 802.1CB 的核心机制。

第八章:冗余与可靠性抗故障IEEE 802.1CBFRER

本节学习目标

  • 理解 FRER 为什么要复制关键帧,并在接收侧消除重复。
  • 知道序列号和恢复窗口如何帮助识别重复与乱序。
  • 能区分可靠性连续性和时间确定性。

本章目录

  1. 01复制与消除:FRER 如何让故障不立刻打断关键流从序列号、复制路径、重复帧识别和恢复窗口理解 802.1CB 的核心机制。
  2. 02冗余路径设计:可靠性、带宽和调度复杂度的交换分析 FRER 多路径不是免费午餐,路径独立性、带宽消耗和调度可行性必须一起看。

解决什么问题

确定性网络不仅要在正常情况下准时,还要考虑故障。单条路径一旦中断,哪怕调度表再完美,关键流也无法到达。FRER 解决的是故障连续性:同一份关键数据走多条路径,只要至少一份到达,业务就可以继续。

接收侧不能把复制来的多份数据都交给上层,否则上层会看到重复消息。因此 FRER 还需要消除重复帧,保留一份有效数据。

背景与直觉

可以把 FRER 想成重要文件同时走两家快递。只要其中一家按时送到,收件人就能使用文件;另一家晚到时,收件人知道这是重复件,不再处理。序列号就像每份文件的编号,帮助收件人判断哪些副本属于同一份数据。

但快递路线必须真的独立。如果两家快递都走同一座桥,桥断了就一起失败。网络里的路径分离也是同样道理。

怎么解决

发送侧为关键帧添加序列信息,并在复制点把帧发往多条路径。网络中间可能经过不同 bridge,最终在消除点汇合。接收侧或中间消除点根据序列号判断重复帧,交付第一份或最合适的一份,丢弃后续重复。

恢复窗口用于处理乱序和延迟差异。如果窗口太小,晚到的合法帧可能被误判;窗口太大,状态开销和处理压力增加。本节的辅助实验可以观察路径故障概率、路径独立性和序列窗口对连续性的影响。

带来了什么新问题

FRER 消耗更多带宽,因为同一份关键数据会占用多条路径。它还可能增加调度复杂度:两条路径都要满足时间边界,否则复制只是提高到达概率,不保证准时。序列窗口、乱序处理和重复消除也需要设备资源。

另一个关键问题是共因故障。路径在逻辑上不同,不代表物理上独立。如果两条路径共享电源、线束、机柜或上游交换机,可靠性收益会被高估。

本节掌握标准

学完后,你应该能解释 FRER 的完整链路:发送侧复制,路径尽量分离,接收侧按序列号消除重复。你也应该能指出 FRER 的边界:它提高故障连续性,但复制后的每条路径仍然需要独立满足时间和资源约束。

frer

同一份关键帧走两条路,接收侧只留一份。

复制和消除解决连续性问题,但仍然需要确定性路径。

timequeuebound

failure drill

准时之外,关键流量还要能扛故障。

调节路径失效率、路径独立性和序列窗口,观察复制与消除如何保护连续性。

FRER 双路径故障演练

教学估算
talkerbridgelistener
FRER
risk 6%

连续性

94%

重复消除压力

29帧

FRER 提高连续性

路径越独立、序列窗口越合理,故障下至少一份关键帧到达的概率越高。

try it

动手调参数

机制拆解

  1. 1发送侧复制关键帧。
  2. 2不同路径提高故障下至少一份到达的概率。
  3. 3接收侧根据序列号消除重复帧。

engineering check

FRER 不能替代什么?