study reader

结合 Time Injection 优化 TSN 中的 Multi-CQF 配置

Towards an Optimized Multi-Cyclic Queuing and Forwarding in Time Sensitive Networking with Time Injection · 2025-06-27

HTML 原稿 PDF

调度算法仿真与测试No Derivatives，仅学习笔记

该论文许可不适合在公开站点发布全文原文或逐字全文译稿。本站提供中文学习资料、原文入口和阅读路线，帮助中文读者理解论文，但不替代论文原文。

本站范围: 中文学习稿
内容来源: 中文精读资料 + 原文入口
阅读规模: 81 个原文段落线索

中文精读学习版：Towards an Optimized Multi-Cyclic Queuing and Forwarding in Time Sensitive Networking with Time Injection

使用说明

这不是论文全文翻译，也不是逐段改写版。由于论文许可属于 no-derivatives，本学习版只基于本地结构化材料，用中文重新组织论文的核心问题、方法、约束、算法和实验结论，目的是帮助中文读者理解论文，而不是替代原文。

当前输入不是只有摘要，而是包含 81 个段落的 full-structure-study-note，已经覆盖背景、建模、约束、算法和实验结果。不过，若要核对公式细节、图表数值、算法伪代码和实验图中的具体分布，仍应配合本地 PDF 阅读。

一句话概括

这篇论文研究如何在 TSN 中为 Multi-CQF 选择合适的多周期组合、把 TT 流合理分配到不同 Queue Group，并通过 Time Injection 调整发送偏移，从而在可接受的时延代价下提升可调度流数量并缩短配置搜索时间。

适合先掌握的背景

1TSN TSN 是以太网确定性通信的一组机制，目标是在工业控制、车载、航空、5G-TSN 等场景中同时承载不同 QoS 要求的流量。本论文的所有问题都发生在 TSN 交换机出口端口的队列与调度配置中。

2TT traffic Time-Triggered 流是周期性、硬实时流量。论文主要只考虑 TT 流，关注它们能否在 deadline 前到达目的端。

3TAS 与 GCL TAS 通过 Gate Control List 控制队列门开关，可以提供严格时延和抖动控制，但 GCL 生成复杂。本论文用 CQF 系列机制作为 TAS 的替代方向，强调配置复杂度更低。

4CQF CQF 使用两个队列按周期交替接收和发送，逻辑简单、时延可界定。但单一 cycle 很关键：cycle 太小装不下流量，cycle 太大又会增加最坏时延。

5CSQF CSQF 在 CQF 基础上引入第三个 tolerating queue，用来缓冲因同步误差、传播延迟差异等导致错过预期周期的流。它能提升可调度性，但往往增加时延。

6Multi-CQF Multi-CQF 在同一出口端口上同时运行多个 CQF/CSQF 实例，每个实例有自己的 Queue Group 和 cycle。它的意义是适配多种时序需求，而不是强行让所有流共享一个周期。

7Schedulability 可调度性在文中主要指算法成功调度的 TT 流数量。论文的许多实验都以“能调度多少流”为核心指标，同时观察运行时间、收敛速度和 WCD。

8Time Injection TI 是源端发送偏移，也就是让某个 TT 流在源节点等待若干个 cycle 后再注入网络。它可以缓解队列竞争、提升可调度性，但也会主动增加端到端时延。

论文要解决的问题

TSN 网络越来越需要同时承载多种实时性要求的流量。传统 TAS 能给出强确定性，但 GCL 配置复杂，随着流数量和网络规模增加，计算代价很高。CQF 和 CSQF 结构更简单，但它们通常依赖单一 cycle，这对混合关键性网络并不理想。

单一 cycle 的矛盾很直接：短 cycle 有助于降低时延，却可能无法容纳同一出口端口上集中到达的大量帧；长 cycle 能提供更大传输窗口，却会推高 Worst-Case Delay。CSQF 增加 tolerating queue 后能容忍某些时序偏差，但仍然受单周期限制。

Multi-CQF 试图解决这一限制：让不同 Queue Group 使用不同 cycle，短 deadline 的流可以走短周期组，宽松 deadline 或不同周期特征的流可以走其他组。但 Multi-CQF 自身带来新问题：周期组合怎么选？流如何映射到 Queue Group？TI 在多周期结构下如何定义和搜索？如果所有组合都暴力尝试，搜索空间会快速爆炸。

这篇论文的目标就是把 Multi-CQF 配置问题系统化：先给出约束，再用领域知识缩小搜索空间，然后用 GA 和 GASA 这类启发式算法寻找较好的配置，并评估 TI 是否能提高可调度性。

核心思路

1把 Multi-CQF 拆成多个 Queue Group 论文把 Multi-CQF 看成同一端口上多个 CQF/CSQF 实例的组合。每个 QG 有自己的 cycle，典型设置为 `QG1` 最短、`QG2` 居中、`QG3` 最长。

2先约束 cycle，再搜索配置周期不是随便给的。它要满足最小传输能力、最大周期边界、hyperperiod 可整除、流周期可整除、不同 QG cycle 之间成整数倍等条件。这样能避免无效或明显危险的周期组合。

3用 DSK 做流到 QG 的预分配 DSK 即 domain-specific knowledge。论文用流的 deadline 或 period 等特征先排序，再把流分到不同 QG。最关键的经验是：deadline 越紧，越应该进入短 cycle 的 QG。

4用 DBM/PBM/RM 比较映射策略 DBM 按 deadline 升序排序，前 50% 到 `QG1`，接着 30% 到 `QG2`，剩余 20% 到 `QG3`。PBM 按 period 排序。RM 随机分配。实验显示 DBM 效果最好，RM 最差。

5把 TI 作为可搜索变量每个流的 TI 是一个非负整数，表示在源节点延迟多少个所属 QG cycle 后发送。TI 的上界由该流周期与所属 QG cycle 的比例决定，确保不会让源端帧无限堆积。

6用 GA 和 GASA 配置路由与 TI GA 的染色体包含每条流的候选路径索引、路径中的交换机数量、TI 值等。GASA 则把 SA 的局部搜索引入 GA，用 SA 风格的 mutation 和 recombination 改善局部搜索与收敛效率。

7优化目标不只看时延，也惩罚违规适应度函数关注端到端时延相对 deadline 的比例，同时对 deadline 违反和带宽约束违反加入惩罚项。这样算法不会只追求低时延而忽略可行性。

8实验核心结论是“更多可调度流，但可能更高 WCD” GA/GASA 通常比基线 SA 调度更多流；加入 TI 后可调度性进一步提升。但 TI 和 CSQF 的 tolerating queue 都可能增加端到端最坏时延。

方法拆解

建模对象

论文把 TSN 网络建模为无向图 `G(V,E)`，节点包括 end stations 和 switches，边表示链路。流集合为 TT flows，每条流有源、目的、周期、deadline、frame size、候选路径等属性。每条流周期性产生 frame，并通过 cyclic shaper 调度。

Multi-CQF 中的核心资源是 Queue Group。每个 QG 有自己的 cycle，例如 `T_QG1`、`T_QG2`、`T_QG3`。论文中的典型设定是三个 QG，并要求周期大小递增。

约束

论文给出一组配置约束，主要包括：

每条 TT 流的 WCD 必须不超过 deadline。
hyperperiod `H` 是所有流周期的最小公倍数。
每条流在 `H` 内产生的 frame 数由 `H / period` 决定。
最小 cycle 要足以发送最大帧，并覆盖处理延迟、传播延迟、同步误差等补偿项。
最大 cycle 与所有 TT 流周期的最大公约数有关。
QG cycle 必须整除 hyperperiod。
流的 period 应能被所属 QG cycle 整除，以便 frame 在 cycle 起点生成。
`T_QG1 < T_QG2 < T_QG3`。
更长 QG cycle 应是更短 QG cycle 的整数倍，以保持门控对齐并避免带宽过度订阅。
每个 QG 在每条链路上的流量不能超过分配给它的带宽份额。
TI 必须落在合法范围内，即不能超过该流 period 中可容纳的 cycle 个数。

算法/机制

论文的方法分成几个模块：

先计算候选路径，使用 K-shortest paths。
对流排序并映射到 QG，主要比较 DBM、PBM、RM。
根据约束生成候选 cycle 组合，并用启发式搜索选出较高可调度性的 cycle 组合。
用 GA 搜索配置，包括路径选择、TI 选择、交叉、变异和精英保留。
用 GASA 把 SA 的局部搜索机制嵌入 GA，用来减少陷入局部最优的风险，并改善运行时间和收敛表现。
基线方法是复现既有文献中的 SA。

复杂度或实现考虑

Multi-CQF 配置问题被视为 NP-hard。论文不追求精确全局最优，而是用启发式和元启发式方法获得较好解。

关键降复杂度思路是先做 flow-to-QG mapping。若每条流都能任意尝试所有 QG、所有路径和所有 TI，搜索空间会很大；先用 deadline 或 period 把流划入 QG 后，搜索变成多个更小子空间的组合，收敛更快。

实现方面，论文提到使用 NetworkX 求 K-shortest paths；实验平台是普通笔记本级 CPU 和 32GB RAM。算法终止条件是若预设迭代内没有改善则停止。

输出结果/系统效果

算法输出的是 Multi-CQF 配置，包括周期组合、流到 QG 的映射、路由选择、TI 值，以及是否满足 deadline 和带宽约束。系统效果通过可调度 TT 流数量、计算成本、收敛速度和 WCD 来衡量。

关键概念中文讲解

1Multi-CQF 背景：CQF/CSQF 单周期难以覆盖混合实时需求。解决什么问题：用多个 QG 和多个 cycle 让不同 deadline、period、负载特征的流进入更适合的周期实例。带来什么新问题：需要决定 cycle 组合、带宽分配、流到 QG 的映射，以及多组门控是否对齐。

2Queue Group 背景：TSN 出口端口有多个队列，Multi-CQF 将队列组织成若干组，每组运行一个 cyclic shaper 实例。解决什么问题：让不同流量类别或时序要求使用不同 cycle。带来什么新问题：QG 之间共享同一链路带宽，若带宽份额或 cycle 配置不合理，会导致某些组拥塞或 deadline 失败。

3Cycle Combination 背景：cycle 决定队列接收/发送切换频率。解决什么问题：合适的 cycle 能在传输容量和时延之间取得平衡。带来什么新问题：没有一个固定 cycle 组合适合所有拓扑和 TC；每个场景都需要重新评估。

4Time Injection 背景：即使周期和映射合理，多个流也可能在同一时间集中进入网络造成冲突。解决什么问题：通过源端延迟注入，把流分散到不同 cycle，从而提升可调度性。带来什么新问题：TI 本质上主动增加等待时间，可能提高 WCD，因此它是“用时延换可调度性”的工具。

5Deadline-Based Mapping 背景：WCD 与 QG cycle 强相关，短 deadline 流放到长 cycle 组容易失败。解决什么问题：DBM 把紧 deadline 流优先放入短 cycle QG，提高 deadline 满足概率。带来什么新问题：固定 50/30/20 的比例是启发式，不一定对所有拓扑、流量分布和带宽配置最优。

6CSQF tolerating queue 背景：广域或同步误差较大的场景中，流可能错过指定 cycle。解决什么问题：第三个队列容忍错周期到达，提升部分场景下的可调度性。带来什么新问题：进入 tolerating queue 的流通常要多等一个 cycle，时延上升。

7WCD 背景：硬实时网络必须关注最坏情况，而不是平均情况。解决什么问题：WCD 给出一条流从源到目的的保守延迟上界，用于 deadline 约束。带来什么新问题：WCD 越保守，可调度性判断越严格；引入 TI 或 CSQF 后，WCD 分析更复杂。

8GASA 背景：GA 有全局种群搜索能力，但可能运行较慢；SA 局部搜索快且能概率性接受较差解。解决什么问题：GASA 结合 GA 和 SA，希望在搜索质量、运行时间、收敛速度之间取得更好平衡。带来什么新问题：混合算法有更多超参数和机制选择，结果依赖参数调优与测试场景。

实验与结果怎么看

作者使用多种拓扑测试，包括 ERG、RRG、BAG 和 Ring。测试用例分为四类：RSD、TSD、RLD、TLD，区别主要在 period 大小、frame size 范围，以及 deadline 是远小于 period 还是等于 period。实验只考虑 TT traffic，且不启用 frame preemption。

主要指标有三个：

可调度 TT 流数量：越多越好。
算法计算成本：总运行时间越低越好。
收敛速度：目标函数越快稳定越好。

几个关键结果：

在 CQF/CSQF 上，GA 和 GASA 通常能比基线 SA 调度更多流。
CSQF 因为有 tolerating queue，常常能调度更多流，但代价是更高端到端时延。
Multi-CQF 中，GA 和 GASA 比 SA 表现更好；加入 TI 后，可调度流数量进一步提升。
TI 会增加 WCD，因为流在源节点被故意延迟。
GASA 的运行时间明显低于 GA，接近 SA，同时收敛速度较快。
周期组合对可调度性影响很大，不合适的 cycle 会显著降低可调度性。
DBM 在多个拓扑和测试条件下优于 PBM 和 RM，说明基于 deadline 的 QG 映射很有效。
Multi-CQF 不保证在所有 TC 中都比 CQF/CSQF 调度更多流，它的核心优势是支持多样化时序需求。

不要过度解读的地方：

实验说明 GA/GASA+TI 在这些测试设置中有效，但不能直接推论所有工业 TSN 网络都会有相同收益。
DBM 表现最好，但固定 50/30/20 分配比例不是理论最优。
论文主要评估 TT 流，混合 BE、AVB、TT 多类型并存时的相互影响还需要进一步验证。
TI 提升可调度性并不等于系统一定更好，硬实时系统还必须看增加的 WCD 是否可接受。

我对这篇论文的看法

这篇论文的贡献比较务实：它没有只停留在“Multi-CQF 可以多周期”这个概念层面，而是把实际配置中最麻烦的几个问题串起来处理，包括 cycle 约束、flow-to-QG mapping、TI 搜索、路径选择和元启发式算法。对工程读者来说，最有价值的是它把“周期选择”和“流映射”从隐含经验变成了可实验、可比较的配置模块。

它的适用边界也很清楚：更适合研究 TT 流主导、需要多种周期需求并存、且无法承受 TAS 复杂 GCL 配置成本的网络。对于严格追求最低时延或极低 jitter 的场景，TI 和 CSQF 带来的额外等待需要谨慎评估。

潜在弱点主要有三点。第一，DBM 的比例和带宽分配仍是启发式设置，离真正自适应配置还有距离。第二，目标函数和惩罚系数对结果有明显影响，虽然作者做了调参，但泛化性仍需更多场景验证。第三，论文重点在配置算法和调度可行性，真实设备实现、标准兼容性、门控精度、运行时重配置等工程问题还需要进一步展开。

后续可以跟进的方向包括：学习型或优化型 flow-to-QG mapping；联合优化带宽份额、cycle、路由和 TI；把 BE/AVB 等非 TT 流纳入评估；在 OMNeT++ 或真实 TSN 设备上验证配置效果；研究在动态流加入/退出时如何增量更新 Multi-CQF 配置。

读完后应该能回答的问题

1为什么 TAS 的 GCL 生成在大规模 TSN 中会成为问题？
2CQF 为什么能简化调度？它的核心代价是什么？
3CSQF 的 tolerating queue 解决了什么问题，又为什么会增加时延？
4Multi-CQF 相比 CQF/CSQF 的关键变化是什么？
5为什么 Multi-CQF 需要多个不同的 cycle？
6为什么短 deadline 流更适合放入短 cycle 的 QG？
7Time Injection 如何提升可调度性？为什么它会增加 WCD？
8论文中 DBM、PBM、RM 的区别是什么？
9为什么 flow-to-QG mapping 能缩小搜索空间？
10GA 的染色体大致编码了哪些信息？
11GASA 相比普通 GA 想解决什么问题？
12为什么不能简单说 Multi-CQF 一定优于 CQF 或 CSQF？

与 TSNBIT 教程的衔接

这篇论文适合放在 TSNBIT 教程中以下内容之后学习：

TSN 基础与 IEEE 802.1Q 队列模型。
时间同步与确定性时延基础。
TAS、GCL 与门控调度入门。
CQF 双队列 ping-pong 工作机制。
CSQF 与 tolerating queue。
周期、hyperperiod、deadline、WCD 的数学建模。
TSN 调度问题中的启发式算法，例如 SA、GA。
工业网络中 TT 流、BE 流、混合关键性流量的基本概念。

最自然的教程位置是：先学完 CQF/CSQF，再进入“多周期 cyclic shaper 与配置优化”章节。它可以作为 Multi-CQF 的进阶案例，用来说明为什么真实 TSN 配置不只是选择一个队列机制，还需要同时考虑周期、路由、流映射、带宽份额和发送偏移。