暂无评论
IPSec SA/IKE SA 存在但流量时通时断,重置 SA 恢复完整排查(H3C SecPath 防火墙)
一、先解读你截图关键信息
Tunnel 状态 Active,ESP 双向 SA 完整存在,IKE 协商正常;
保护流:源 192.168.2.0/24 → 目的 172.16.0.0/12;
现象:隧道在线,但流量随机断流,手动删除 SA 重建立刻恢复,典型SA 老化 / 报文丢包 / 分段 / 路由 / 安全策略类问题。
二、根因分类(按出现概率从高到低)
1. IKE/IPSec SA 生存时间不匹配,旧 SA 未及时删除(最高发)
故障逻辑
IKE SA 默认 86400s,IPSec ESP SA 默认 3600s;
到达 IPSec SA 生命周期时,设备会发起重协商;
若协商报文被防火墙 / 运营商拦截,新 SA 建立失败、旧 SA 老化删除,流量中断;
手动删除 SA = 强制重新协商,临时恢复。
验证 & 修复
查看生命周期
plaintext
display ike sa verbose
display ipsec sa verbose
对比 IKE、IPSec 老化时间,建议缩短 IPSec SA(3600→1800),减少长时间断协商窗口:
plaintext
ike proposal 10
sa-duration 3600
ipsec proposal 10
ipsec policy map 10 isakmp
sa-duration 1800
放行两端公网 UDP 500/4500、ESP 协议 50,运营商 / 对端防火墙不能拦截。
2. 公网 UDP 500/4500、ESP 报文被运营商 QoS / 防火墙丢弃
IPSec 协商、保活报文小包,运营商流量整形、防攻击策略容易丢小包:
抓包看断流时段:公网口收不到对端 IKE 协商报文;
解决:
两端防火墙放行 ESP、UDP500/4500;
运营商侧取消对 ESP/500 端口限流;
开启 IKE 保活心跳:
plaintext
ike keepalive interval 10 retry 3
定时发送探测报文,防止运营商静默断流。
3. 报文 MTU 分段异常,大包丢、小包能通(表现时通时断)
内网大包(文件、视频)超过隧道 MTU,不分片直接丢弃,小包正常:
IPSec 隧道默认 MTU 1400,内网 PC MTU 1500 产生 1460 大包;
修复方案二选一:
plaintext
# 方案1 隧道全局MTU
ipsec tunnel mtu 1400
# 方案2 内网PC/交换机下发TCP MSS
tcp mss 1360
4. 回程路由浮动 / 等价路由 ECMP 导致流量往返不对称
内网访问对端 172.16.0.0 回程存在多条路由,来回路径不一致;
IPSec 要求加密前明文流量进出同一接口,来回接口不同会解密失败、流量中断;
排查:
plaintext
display ip routing-table 172.16.0.0
确保去往对端业务网段只有唯一静态路由,无浮动路由、策略路由干扰。
5. 安全策略 / 域间策略老化、会话表满
外网 untrust→内网 trust 会话表打满,新建流量被丢弃;
IPSec 解密后内网访问策略临时失效;
plaintext
display session table statistics
会话占比 90% 以上则调大会话表容量,缩短老化时间。
6. NAT 干扰(内网源 NAT 与 IPSec 保护流冲突)
内网 192.168.2.0 访问 172.16.0.0,若匹配内网出外网源 NAT,源地址被转换,流量不匹配 IPSec 保护流,直接不通;
必须配置IPSec 豁免 NAT:
plaintext
acl number 3000
rule permit source 192.168.2.0 0.0.0.255 destination 172.16.0.0 0.0.15.255
nat address-group 0
nat policy no-nat
rule permit acl 3000
nat none
没有豁免 NAT,流量随机匹配 NAT 就会时断时续。
7. 两端加密算法 / 校验算法不一致,重协商失败
一端 AES-256+SHA2-256,另一端 AES-256+SHA1,初始协商成功,但 SA 老化重协商失败,流量中断;
核对两端 ike proposal、ipsec proposal 加密、认证算法完全一致。
8. 设备 CPU / 内存高,协商报文处理延迟
plaintext
display cpu-usage
display memory
CPU 长期 80% 以上,IKE 协商线程处理不过来,重协商超时断流。
三、快速定位排查步骤
开启 IKE 保活,观察断流是否减少;
配置 NAT 豁免,排除内网源地址转换干扰;
调整 TCP MSS 1360,解决大包丢包;
核对两端 IKE/IPSec SA 生命周期、加密算法完全统一;
检查去往对端业务网段唯一回程路由,无 ECMP 浮动;
公网口抓包,确认 UDP500/4500、ESP 无丢包;
监控会话表、CPU 资源占用。
极简总结
最常见 3 个诱因:
缺少 IPSec 免 NAT 策略,内网流量随机被 NAT 转换,不匹配保护流;
SA 老化重协商时 UDP500/ESP 小包被运营商拦截,新 SA 建不起来;
MTU 不匹配,大包分段丢弃,表现时通时断。
删除 SA 重建只是临时恢复,必须解决上面底层问题才能根治。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论