learn

最坏情况指标：平均延迟为什么不够

学习 TSN 验证中应该关注最大值、分位数、deadline miss、抖动范围和测量误差，而不是只报告平均延迟。

第九章：验证与进阶阅读工程闭环TSN Validation20 分钟

first read

先抓住结论

验证不是证明某次通信成功，而是证明边界在给定条件下可复现。

看关键参数读完整正文

这节主要调哪些参数

背景压力
测试时普通流量、突发和设备负载有多接近真实或最坏条件。
测试样本
报告用多少观测点支撑延迟、抖动和丢包判断。
时间测量精度
时间戳、抓包和时钟同步能分辨多小的差异。

本节学习目标

能区分平均延迟、最大延迟、分位数和 deadline miss。
理解测量误差必须进入验证结论。
知道 TSN 报告为什么要关注尾部和边界。

建议先读

可观测性计划：TSN 测试要留下哪些证据突发与尾延迟：平均负载为什么会骗人

核心概念

worst-case latencypercentiledeadline missmeasurement error

本章目录

parameter insight

关键参数与横向比较

让 TSN 结论从口头判断变成可审查报告。

背景压力

测试时普通流量、突发和设备负载有多接近真实或最坏条件。

轻载成功不能证明高负载安全；重载测试更能暴露边界风险。

改变测试结论的可信范围和可迁移到现场的程度。

测试样本

帧

报告用多少观测点支撑延迟、抖动和丢包判断。

样本少容易漏掉尾部；样本多更能支持最坏情况统计。

影响漏检风险和报告可信度。

时间测量精度

时间戳、抓包和时钟同步能分辨多小的差异。

精度高能支撑紧窗口；精度低会让结论只能更保守。

决定延迟和窗口命中证据是否足够细。

一次成功截图 vs 可复现报告

截图只能说明某一次看起来成立。

可复现报告保留输入、配置、负载、抓包和统计。

验证的对象是边界和证据链，不是漂亮结果。

解决什么问题

验证报告最常见的问题是只写平均延迟。平均值可以描述常见体验，却不能证明关键控制流每个周期都满足 deadline。TSN 更关心尾部、最大值、miss 次数和测量误差。

本节解决的是指标选择。没有正确指标，再多测试也可能得出错误信心。

背景与直觉

如果电梯平均等待 10 秒，但偶尔等 5 分钟，用户体验仍然很差。控制网络更严格：如果 deadline 是 500 us，一次 900 us 就可能是失败。平均值会把失败样本稀释掉。

怎么解决

报告至少要同时给出这些指标。

指标	含义	TSN 价值
average latency	平均表现	只能做背景参考
maximum observed latency	测试中最大样本	接近边界判断
percentile	尾部趋势	观察低频风险
deadline miss count	超过 deadline 的次数	直接判断失败
jitter range	周期波动	控制质量相关
measurement error	时间戳不确定性	影响结论可信度

如果 deadline 是 500 us，最大观测延迟是 492 us，但测量误差可能有 +/- 15 us，那么不能简单说安全。你需要把误差预算写进结论。

带来了什么新问题

关注最坏情况会迫使测试更严谨。样本量不足会漏掉低频问题，背景流量不真实会低估尾部，测量精度不够会让边界判断模糊。

同时，最大观测值也不是数学最坏值。它只能说明测试覆盖范围内的结果，因此报告必须写清场景和限制。

检查点

为什么平均延迟 80 us 不能证明 500 us deadline 一定安全？
如果测量误差是 20 us，最大观测延迟距离 deadline 只有 10 us，你会怎样写结论？

掌握检查

读完本节后，先用下面这些问题校准自己，而不是只确认“看过了”。

1能说明一份只给平均延迟的报告缺少哪些关键结论。
2能把测量精度写进 deadline 判断。

next steps

读完这一页，下一步可以这样走。

继续到下一节时间同步证据：没有共同时间，延迟数字也会失真学习 TSN 验证中如何记录 gPTP 状态、时间戳来源、offset、grandmaster 和测量时钟，避免把不同时间基准下的数字硬比较。继续查一个工程问题TSN 时间敏感网络是什么？TSN 是 IEEE 802.1 的一组确定性以太网能力，用共同时间、调度、整形、资源预留和冗余机制，让关键流量获得可分析的延迟和抖动边界。继续