华为无线网络常见故障:终端网络慢故障定位方法

2023-11-24 09:02:16

1.通过ping包判断故障范围。

1)终端ping网关出现频繁丢包、延迟波动,说明故障出现在网关以下的网络中。

2)终端ping网关正常,ping外网地址出现不稳定,说明故障出现在网关以上的网络中。

2.查看AP的CPU利用率是否正常。

如果AP的CPU利用率一直很高(大于80%),会导致业务异常,出现丢包、网络延迟大等问题。

命令:display cpu-usage //AP的诊断视图

3.查看AP的信道利用率是否正常。

1)wlan网络中所有终端共享带宽,相互竞争带宽资源。

2)如AP接入终端数量多或有大量的广播和组播报文,相互抢占信道的情况就会很严重。

会导致信道利用率高,无线网络抖动,ping包延迟大,丢包。

命令:display radio all

3)正常情况下,信道利用率超过70%,可能会对用户网络产生影响。

4)导致信道利用率高的原因有一下几点:

①AP同频干扰;

②组播、广播报文过多。

注意:组播、广播报文都是低速率发送,消耗空口资源多。

4.查看AP系统报文缓存资源的剩余可用buffer资源是否正常。

AP的转发模块和Wi-Fi收发包模块共用一个buffer资源池,AP剩余可用的buffer资源要保持在100以上,否则认为AP的buffer资源不足,会出现丢包情况。

命令:display memory-pool info //AP下诊断视图

5.查看发包队列是否存在拥塞或者被占满的情况。

1)报文到达AP Wi-Fi驱动模块后,会先缓存在队列中等待调度发送;

2)如果Wi-Fi驱动模块缓存队列被占满或者拥塞严重,则会出现丢包、延迟大的情况。

3)常见的原因有终端弱信号。

命令:display lmac txq-buf radio 射频ID //AP下诊断视图

4)正常情况下Wi-Fi驱动模块的缓存队列基本处于0占用的状态,不会持续处于被占用的情况。

5)如果AP Wi-Fi驱动模块的缓存队列出现拥塞,查看每个终端占用队列的具体情况。

命令:display lmac sta-statistics queue-status radio 射频ID //AP下诊断视图

6)注意mpdu total num不超过20。

6.查看AP接口上接受到的组播和广播报文的统计信息是否正常。

1)WLAN网络中发送组播、广播报文时,因为报文不会重传,所以为了确保接收端的

收包成功率,都是以较低速率发送。

2)如果网络中有大量的组播、广播报文往空口发送,会导致空口资源浪费严重,出现

信道利用率持续升高,影响无线终端正常的上网体验,出现延迟大、丢包的情况。

命令:display interface 端口号

3)多次执行此命令,观察报文增长情况。

4)开启二层网络隔离来解决广播、组播报文过多问题。

命令:

在AC的流量模板下配置用户二层隔离功能。

wlan

traffic-profile name default

user-isolate l2

quit

在交换机或AC上开启接口的广播和组播报文限速功能。

interface 端口号

broadcast-suppression packets 1000

multicast-suppression packets 1000

quit

7.通过rf-ping命令检查问题终端的信号强度和速率是否正常。

1)无线终端信号强度弱,会导致收、发包出现重传的情况;

2)导致无线信号强度弱的常见原因包括:

①终端与AP之间存在障碍物,如墙体、建筑物等。

②终端所处区域内没有规划AP进行覆盖。

③终端与AP之间的物理距离较远。

命令:

wlan

rf-ping -c 100 终端MAC

3)需要关注发包速率(Tx rate)和信号强度(RSSI)。

display station sta-mac 终端MAC //查看终端是否关联到远端AP。

dis station neighbor sta-mac 终端MAC

4)如果邻居列表中存在SNR比STA当前关联的AP的SNR高,则说明终端可能关联到了远端AP。

8.查看是否存在建链速率低的终端在做大流量业务。

1)AP下关联低速率下做大流量业务的终端,可能会导致该AP下的其他用户无法正常上网,

该终端停止业务后,其他用户恢复正常。

命令:display station ap-id APID //查看该AP下是否存在建链速率低的终端。

注意:在有业务的情况下,如果终端的建链速率(Tx或Rx)小于30Mbps,说明该终端的建链速率低。

命令:display station statistics sta-mac 终端MAC //查看终端下的统计。

2)一般认为,如果终端流量超过10M,说明该终端在进行大流量业务。

3)对单个终端进行限速。

命令:

wlan

traffic-profile name p1

rate-limit client up 20000

rate-limit client down 20000

9.检查AP的IP地址是否冲突。

一个AP与其他AP产生IP地址冲突,会导致SSID不稳定,用户频繁掉线。

命令:display ap all //查看是否有IP冲突情况。