iMC SHM典型配置

关键词:
功能需求

一、组件概述

服务健康管理组件(以下简称SHM),包含服务健康管理和NQA管理两大部分,定位于IT服务的健康监控管理方案。服务健康管理模块基于iMC系统的性能、告警、NQA链路监控,NTA流量分析等业务模块,提取关键性能指标(KPI),建立服务各个方面质量的度量指标(KQI)以及服务整体质量的度量模型(SLA),基于服务可用性、平均故障间隔时间(MTBF)、平均故障修复时间(MTTR)等的监控和分析对服务的健康水平做出评价。

NQA管理模块主要提供与网络性能监控有关的NQA特性网管侧的管理。运营商可以根据客户的要求对NQA任务进行管理,并对已经创建的NQA实例任务进行监控。它通过获取抖动、时延、丢包率等指标数据来量化网络提供的服务质量,是当今一种有力的网络性能度量和诊断工具。NQA链路监控可以支持H3C、华为、Cisco等厂商的设备,度量的基本指标项包括HTTP、FTP、TCP、UDP、DHCP、DLSW等15种。

需要注意的是,SHM同其他iMC组件一致,需要基于iMC平台而不能独立运行,使用时对照版本说明书注意组件之间的适配。

 

      

组网信息及描述

 二、组网

 

网管站(SHM)在源设备部署一系列的NQA实例,源设备向目标设备定期发起业务仿真报文,并形成相应业务的抖动、延时、丢包率等多维度的基础度量数据,网管站从源设备采集原始的度量数据,经过汇总和加工,形成网络业务端到端的NQA服务质量数据。

源设备(SW1)可以是支持H3C NQA MIB的华三设备,支持华为Ping MIB的华为设备,支持Cisco Ping MIB的Cisco设备以及支持标准Disman Ping MIB的任何第三方设备。而目标设备(Fat AP)根据测试业务的不同,可能是网络设备、应用服务器甚至PC机。

本文以监测SW1 E1/0/2口和Fat AP GE1/0/1口之间的链路健康状况为例进行典型配置实例,中间链路部分(SW2)在实际情况中可以是internet,只要源设备和目标设备网络可达即可。

三、SHM配置流程图

SHM采集NQA、NTA、性能、告警等性能指标(即KPI),通过KQI建立质量管理的模型,通过SLA管理建立对具体设备和链路的检测实例。

1.配置NQA(网络质量分析)链路监控

基于IP网络实现语音、视频、网络连接等业务的时延、抖动、丢包、吞吐量等指标的监控和度量。

2.KQI(关键质量指标)

KQI 基于性能、告警、NQA链路监控、NTA等业务模块提取KPI(关键性能指标),对服务某个方面的质量建立度量模型,并通过KQI复合实现多层次的服务质量监控。

3.SLA(服务水平协议)

通过对服务各方面KQI的度量及综合分析,对服务水平作出度量和评价。

 

配置步骤

四、配置步骤

1.配置源设备和目标设备SNMP参数,必须与iMC上配置一致;

[H3C] snmp-agent

# 启动SNMP

[H3C] snmp-agent community read public

# 配置SNMP读团体字,根据实际情况进行修改,请使用相对加密程度较高的密码,注意不要使用常用词

[H3C] snmp-agent community write private

# 写团体字,根据实际情况进行修改

[H3C] snmp-agent sys-info version all

# 配置设备支持的SNMP版本,all的含义是设备自适应所有的SNMP协议版本

[H3C] snmp trap enable

# 启动SNMP Trap告警

[H3C]snmp-agent target-host trap address udp-domain 192.168.113.12 params securityname public v2c

# 配置发送Trap告警的目的地,注意必须使用和网管地址一致的地址

[H3C]snmp-agent trap queue-size 500

[H3C]snmp-agent trap life 600

# 配置Trap队列及生存时间,建议修改,因为对于某些告警如Coldstart在启动的时候需要保存较长时间才可以发送出来

2.iMC配置

1) 在NQA设备中加入这两台设备。

2) 我们这里指定指定由SW1(H3C)向Fat AP(ywrjap1)发送探测报文,选择AP后面的修改udp配置,然后增加UDP server 地址(B本机的互通地址,也就是要探测的目的ip地址,端口用缺省的1000即可,如果设备上有过修改这里也要修改)

3) 增加NQA分组

增加一个NQA分组后,可以在NQA分组下增加NQA实例。

4)增加NQA实例

选择源设备目的设备,进行配置下发,设置好参数后可以点击测试,测试成功进行下一步(注意测试失败时仍可以进行增加或者修改完成操作,但是配置不一定能够正确下发,此时请检查参数配置是否正确):

选择NQA实例执行时间和采集周期、告警策略

此时可以看到NQA实例列表及NQA实例信息

5)增加SLA

选择按照服务模型增加,按照实际情况选则模型

选择设备接口,配置服务模型,若参数为绿色表示参数已部署,若为红色表示未部署,此时点击配置参数,配置好参数后点击参数下发,下发成功后变成绿色。

输入服务名称,配置参与服务评价的KQI及评分标准。

设置好各项参数后点击确定,可以看到SLA的列表及可用性、健康性,等待5分钟后可以看到各项监控数据。

配置关键点及注意事项

五、注意事项:

1.配置下发测试失败时仍可以进行增加或者修改完成操作,但是任务不一定能够正确下发,此时请检查参数配置是否正确。

2.特别注意的是,在新建NQA实例时选择NQA种类中若包含多个指标,若有一个指标未达成,则实例的达成率为0.

3.在NQA达成率为0时,可在设备上通过如下两个命令检查nqa状态:

 

4.正常的qna实例和SLA配置完成后,使用display current-cofiguration 也可以看到nqa相关信息,如果有实例达成率为0可以对照。

#

nqa entry 1 1

 type tcp

  destination ip 192.168.112.254

  destination port 7

  frequency 300000

  probe count 10

  source ip 172.16.2.254

  tos 10

  ttl 10

#

nqa entry 2 2

 type udp-echo

  data-fill aaa

  destination ip 192.168.112.254

  destination port 7

  frequency 300000

  probe count 10

  source ip 172.16.2.254

  source port 1000

  tos 10

  ttl 10

#

nqa entry imclinktopologypleaseignore ping

 type icmp-echo

  destination ip 192.168.113.252

  frequency 270000

#

 nqa schedule 1 1 start-time now lifetime forever

 nqa schedule 2 2 start-time now lifetime forever

 nqa schedule imclinktopologypleaseignore ping start-time now lifetime forever

 nqa server udp-echo 192.168.113.19 1000

案例信息

案例类型:典型配置
案例号:201603290001
创建时间:2016年3月29日
更新时间:2016年4月6日
发布时间:2016/4/6 4:01:25
文章密级:游客可见
有效期:长期有效
发布者:边旭东 [b11762]
点击次数:2612
评论平均得分:5.00
关键词:iMC,SHM,配置
产品线:iMC产品线-云&网管平台
产品系列:iMC-智能管理平台
产品版本:V7
技术分类:业务软件产品技术 iMC

常用操作
收藏