以下是详细的排查步骤,请按顺序进行:
一、 紧急恢复与信息收集(先恢复业务)
立即重启AP:这是最快释放被占满资源的临时解决方法。通过AC远程重启,或到现场拔插AP电源。重启后终端通常能暂时连接上,为你赢得排查时间。
记录关键状态:在重启前或重启后,立即登录AP或AC的管理界面,记录下:
CPU/内存利用率:在系统状态里查看,如果持续高于80%就非常危险。
射频状态:查看2.4G和5G的信道利用率(Channel Utilization)。这是黄金指标,如果长期高于50%,说明无线环境非常繁忙,干扰严重。
终端详情:记录下7台在线的终端MAC地址、连接的SSID、信号强度、协商速率、数据流量。
二、 根治排查步骤(按可能性高低排序)
1. 排查无线环境干扰(最常见原因)
“网页慢”和“伪满载”很可能是严重干扰导致AP不断重传,CPU飙升。
2. 排查物理链路和上层网络
AP到核心的链路不稳定,会导致数据重传、认证延迟,消耗AP资源。
检查AP有线口:登录AP连接的交换机,查看AP上行端口的错误包计数、CRC错误、丢包率。更换网线测试。
Ping测试:在AC上或在AP的调试模式(如果有)下,让AP持续Ping网关和DNS服务器,观察是否有高延迟或间歇性丢包。这指向有线网络问题。
检查DHCP:确认DHCP服务器地址池是否充足。虽然地址耗尽不会提示“满载”,但会导致终端无法获取IP,感觉像连接问题。
3. 排查异常终端和流量
7台终端中可能混有“问题终端”。
流量分析:在AC或AP上查看7台终端的实时流量和历史流量。是否有终端在持续高速下载/上传(如P2P下载、病毒木马、设备同步)?
终端兼容性:是否有非常老旧的手机、物联网设备等,其Wi-Fi驱动或协议兼容性差,发送异常报文消耗AP资源?尝试逐台断开可疑终端,观察AP负载是否恢复正常。
ARP攻击/广播风暴:在交换机上对AP端口做抓包(或开启端口镜像),分析是否有大量ARP请求、广播包。
4. 检查AP配置与固件
三、 重点命令与查看路径(针对H3C设备)
通过AC(通常是h3c.com风格命令行)诊断:
# 查看AP的运行状态和CPU/内存
display wlan ap name WA6528-xxxx verbose
# 查看AP的射频状态,重点关注“Channel busy”字段
display wlan ap name WA6528-xxxx radio 1 # 查看radio 1 (通常2.4G)
display wlan ap name WA6528-xxxx radio 2 # 查看radio 2 (通常5G)
# 查看连接到该AP的所有客户端详细信息
display wlan client ap name WA6528-xxxx verbose
# 在AC上Ping测试AP的管理IP,检查连通性
ping -c 100 -t 1 AP的管理IP # 发送100个包,间隔1秒,看有无丢包
总结与建议
优先顺序:环境干扰/链路质量 > 异常终端 > 配置/固件。干扰是最大“隐形杀手”。
对比观察:在业务闲时(如深夜)和忙时分别测试,如果闲时一切正常,忙时出问题,则干扰或终端问题的概率激增。
最小化测试:如果条件允许,创建一个全新的、无任何限制的测试SSID,只让一两台终端连接,看是否还出现“满载”。如果问题消失,则问题出在配置或已连接的大量异常终端上。
请按照上述步骤逐一排查,并反馈关键发现(如信道利用率截图、CPU状态、异常终端流量等),以便进行更精准的分析。
暂无评论