问题描述

【产品型号】

H3Cloud OS(云操作系统)

H3C License Server

【涉及版本】

H3Cloud OS E1131 - E1136H01版本()

License Server VCFC配套的E2180P07H01 版本()

【问题描述】

H3Cloud OSLicense Server之间的网络中断一段时间后,H3Cloud OS授权管理中概率性出现连接License Server失败的现象。

l  如果是使用H3Cloud OS自带的License Server在主节点服务器上执行netstat -anp | grep 5555 | wc -l 返回值超过1020或者多次执行发现数值不停增加。

l  如果是使用独立的License Serve,在License Server服务器上多次执行netstat -anp |grep 5555 | wc -l返回值超过1020或者多次执行发现数值不停增加。

   同时,出现此情况时,License Server上日志占用空间可能会很大,有可能导致磁盘空间占满。

原因分析

【原因分析】

H3Cloud OSLicense Server的连接断开一段时间后,H3Cloud OS每分钟会发起一次连接,在重连时只完成了初始的TCP连接,H3Cloud OS上负责后续TLS连接的线程异常,整个连接尚未完成,又不断发起重连,导致License Server上的连接数超出规格。

License Server侧认为H3Cloud OS已经连接成功,每次重连都认为是一个新的连接,导致连接数不断增长,直至连接数占满。同时,日志文件的记录默认对于每一次客户端连接都有详细的记录,由于没有做日志等级的区分,时间长了有可能导致磁盘空间占满。在新主线版本中已经优化,对日志做了分类和开关。

规避措施/解决方案

【规避措施】

License Server侧操作:

(1)  执行ls -lh /opt/LicServer/log/,查看licmcore.log文件大小,如果该文件很大且占用磁盘大部分空间,则执行 rm -rf /opt/LicServer/log/licmcore.log 删除该日志文件。

(2)  执行service licscore restart重启license-server核心进程。

a)        如果出现重启失败现象,则将后台的licscore进程杀掉。如下所示:

b)        启动licscore进程。如下图所示:

(3)  执行service licsmonitor restart重启license-server监控进程。

a)        如果出现重启失败现象,则将后台的licsmonitor进程杀掉。如下所示:

b)        启动licsmonitor进程。如下图所示:

 

H3Cloud OS侧操作:

(1)  重启coreapi容器,重启后会将连接释放。重启方法如下:

a)        H3Cloud OS主节点上执行命令,查询coreapi容器名,查询方法如下:

b)        重启coreapi容器,约30秒左右能重启完毕,重启过程中coreapi状态为“Termnating”,重启完成后变为“Running”为正常状态。

(2)  H3Cloud OS云管理平台授权管理中,重新连接License Server,即可连接成功

 

【解决方案】

H3Cloud OS E1136H04及之后版本已经解决

案例信息

案例类型:技术公告
案例号:201702130011
创建时间:2017年2月13日
更新时间:2017年3月5日
发布时间:2017/2/13 15:39:29
文章密级:游客可见
有效期:长期有效
发布者:王剑虎
点击次数:1823
评论平均得分:0
关键词:H3Cloud OS,连接,License Server,异常
产品线:H3Cloud OS
产品系列:H3Cloud OS
产品版本:
技术分类:H3Cloud

常用操作
收藏