POS 口物理 UP、协议 DOWN,大量 CRC/FCS 错包故障完整分析
一、两张截图核心异常点汇总
1. 共性关键配置冲突(最核心故障根因)
两台 POS 接口时钟均为 clock slave(从时钟)
SDH/STM-1 POS 链路两端必须一主一从:一端clock master、一端clock slave
两端全配置 slave,无统一时钟源,比特同步错乱,持续产生 CRC/FCS 校验错误,PPP 协议无法协商 UP。
2. 海量校验错误佐证时钟不同步
Pos 2/2/0:1603597 errors、1219111 CRC 错包
Pos 2/2/1:1446566 FCS errors
大量 CRC/FCS 报文校验失败 → PPP 收到破损报文,LCP 协商反复失败,链路协议 DOWN。
3. 其他配套异常佐证
两端 CRC/FCS 均为 32bit,校验模式匹配,排除 CRC 长度不一致问题;
光功率正常,排除光模块、光纤衰减硬件故障;
物理层 state UP,光通道通,仅二层 PPP 协商失败,问题集中在同步时钟。
二、故障原理
POS over SDH/STM-1 属于同步串行链路,必须有唯一主时钟提供比特同步:
两端全 slave:设备无参考时钟,接收端采样偏移,比特流错乱;
每帧报文校验失败,CRC/FCS 计数疯狂增长;
PPP LCP 报文持续校验错误,无法完成协商,Line protocol state DOWN。
三、修复配置(二选一,推荐方案 1)
方案 1:本端设 Master,对端保持 Slave(标准规范)
设备 A(Pos 2/2/0)修改为主时钟
bash
运行
system-view
interface Pos 2/2/0
clock master
# 清空原有错误统计,便于观察修复效果
reset counters interface Pos 2/2/0
对端设备(Pos 2/2/1)维持clock slave不变
方案 2:对接传输设备取时钟
如果上联 SDH 传输设备,路由器 POS 统一配置clock slave,由传输提供主时钟;
当前场景是路由器直连 POS 互联,不能两端 slave,必须一主一从。
四、修复后验证步骤
配置完成等待 3~10 分钟,观察接口状态:
bash
运行
display interface Pos 2/2/0
Line protocol state变为 UP;
2. 持续查看错误计数器,CRC / FCS errors不再增长;
3. 测试互联网段 IP 互通,PPP 链路正常转发流量。
五、补充次要排查点(时钟改完仍异常再检查)
两端 scramble 加扰配置一致(截图里 scramble 均开启,匹配无问题);
两端 MTU、PPP 认证配置一致;
SDH 告警字段存在 AU-AIS、TIM、RDI:同步修复时钟后传输层告警同步消除;
若修改时钟后短时仍有少量错包,属于历史累积计数,reset counters清零后观察新增错误。
总结
根本原因:两端 POS 接口时钟均为 slave,无主时钟同步,比特流校验失败导致 PPP 协议无法 UP,光衰正常可排除光纤 / 光模块硬件问题,修改一端为 clock master 即可根治。
请问现场两端POS上联均是SDH设备我们路由器侧如何排查
请问现场两端POS上联均是SDH设备我们路由器侧如何排查
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明