知

安全产品cpu单核高排查思路

2天前发表

0关注
1收藏 36浏览

陈美静

陈美静五段

粉丝：6人关注：14人

组网及说明

一、背景知识

1、所有V7的安全硬件设备（不包括-V这种部署在服务器上的虚拟设备），在运行流量转发、nat、LB、VPN、安全策略等功能时都需要消耗设备的CPU硬件资源，这就会导致大流量的情况下，CPU占用率较高。

2、防火墙单CPU（盒子设备一般就一颗CPU，分布式设备一般一块板卡一颗CPU或一个子卡一颗CPU）目前在网的大部分型号都是非X86的，一颗CPU会虚拟出多个VCPU，俗称单核。

3、流量上墙后如果要上CPU处理，默认的是根据源地址hash上到某一个单核处理，即源地址相同的流都上到同一个单核处理。cpu核心分为控制核与转发核。以下图为M9K为例，为48核（前4为控制核，后44为转发核，转发业业务在转发核处理）：

如上图，一个cpu虚拟出48个核，单核最大承担数=本板卡吞吐/48，单核的最大占比约为2.1%左右（会有抢占的情况，故也会存在占比稍超过2.1%情况）。

告警信息

当单核高的时候会有一下日志伴随打印：

%Jun 26 09:20:55:596 2026 xx/1/CORE_EXCEED_THRESHOLD: -Slot=2.1; Usage of CPU 1 core 45 exceeded the threshold (95%).//单核阈值超过95%

%Jun 26 09:22:00:276 2026 xx/5/CORE_RECOVERY: -Slot=2.1; Core usage alarm CPU 1 core 45 removed. //单核阈值恢复

问题描述

查看此时设备的kdrv情况（例如下图，5s内单核达到1.4%，但1min、5min都0.2%，说明存在飘高现象，不是持续性高），查看的方式参考背景知识中命令

当单核偏高时候，最常见的原因包含但是不限于以下方式：

1、设备新建流量大，包括正常突发，大象流突发、异常攻击等

2、如果是高端设备存在逻辑情况时候，逻辑无会话引发流量全部上CPU处理。具体参考 https://zhiliao.h3c.com/Theme/details/182583

3、由于开启dpi、二层（vlan-if）、会话引流等，压低了本身可承载流量

上述原因归纳出主要原因就是（1）CPU正常时候，但是处理的流量增大了，或者（2）CPU的处理能力下降，正常流量引发CPU负荷过载。

本着以上的原因排查过程如下过程分析

过程分析

一、单核故障持续存在。

1、查看此时的会话统计信息：display session statistics summary

这种方式可以判断目前设备的新建+并发数情况，对比正常时候的诊断就会得知目前的流量是不是徒增了

（例如会话打到了40W，可能是多个流量都偏高，若8w这种，可能是单个流量偏高，酌情自行判断）

2、查看近一个时间段内的会话数（排名统计开关一下再去查看回显，主要看是否有某些异常流量会话迅速增长，因top统计是累加值，故需要重新开关）：

undo session top-statistics enable

session top-statistics enable

3、前面两点可以找到了会话增高的对应ip（多找几个ip都看下），display session table sou ip +上面的回显比较突出的（ver）可以看到具体的会话，便于现场确认具体业务。

如若大量会话状态为SYN_SENT、SYN_RCVD，TCP_CLOSE，等等之类的，这种会话设备上不会大量存在，反推这种IP一定是异常的，大概率是存在异常流量攻击，或者扫描类的流量，建议客户排查IP并阻断。

4、直接查看单核占用的记录，display attack-defense cpu-core flow info chassis X slot Y cpu 1 （X=框号，Y=槽位号）查看对应板卡处理的攻击流量（中高低端新版本都支持该命令）。

例如现场的回显，可以看到源目ip对应的流量消耗的cpu高达97%，和现场明确该对应业务类型及是否正常。若为异常流量请及时进行阻断等规避措施。

5、可以修改接口的flow-interval时间为5s，然后查看

display counters rate inbound interface和

display counters rate outbound interface

是不是设备存在大量的广播和组播

6、在不得已的情况下，可以基于抓包排查单位时间内哪些报文占比整网的流量大，或者发包速度快，大概率就是引发单核高的五元组（某一单核高，但top-session没有特别突出的，可以单核抓包进一步判断）。

注：中低端web全局抓包，高端设备需要基于单核抓包，抓包脚本请联系400获取。

二、故障不定时出现，且无故障时环境。

1、确认客户侧是否存在监控平台或NDR设备等，查看异常时间段是否存在异常流量，以及是否上送接口，确认是不是存在故障时间点前后接口流量突增，流量增大情况；

2、查看如下命令有没有记录 display attack-defense cpu-core flow info chassis X slot Y cpu 1

3、手工配置一个EAA脚本实现自动化监控，待故障复现收集信息分析（高端设备，中低端web抓包）。

脚本内容也同步查看：cpu、kdrv、内存、接口流量（统计周期改为5s）、会话量。

可参考：https://zhiliao.h3c.com/Theme/details/219268

注：不定时偏高大概率原因和上述的所有情况是一致的，因为不定时无法准确固定去五元组，所以定位相对困难。

解决方法

总结就是某一条或几条流量非常大导致单核被占满。排查问题的主要思路就是找到影响单核的流量信息。与现场确认并判断是否是异常流量，如果是异常流量，建议在上行设备配置阻断（防火墙上配置阻断需要消耗CPU算力，效果可能不明显），如果是正常流量在具体判断是否可以开启逐包转发等。

如果找到了异常高流量，但均属于正常业务流量，如何优化？

1、不让该流量上送设备（调整流量走向）；

2、对该部分业务流量限速；

3、关闭DPI；

4、开启逐包；

5、配置攻击防范动作。

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

安全产品cpu单核高排查思路

组网及说明

告警信息

问题描述

过程分析

解决方法

编辑评论

提出建议