作者:监控易 来源:美信时代 发布时间:2024-06-12
现阶段的智能运维管理软件,功能都相对比较完善,包括诸如IT基础监控、网络管理、资产管理、自动巡检等。在网络运维的不同阶段或者不同的部门,每个运维团队的关注重点可能不同,但对于系统长期运行的可靠性,是所有运维团队都会关注的,因为作为一款运维产品,其本身的稳定性和可靠性必须要经得住严格指标的考验。
能够长期稳定运行是美信监控易的优势特点。其他产品会遇到痛点,比如某运维产品在运行一段时间后出现卡顿、延迟等问题,而美信监控易则不会出现这样的问题。
下面,我们来分析美信监控易与其他运维产品的不同和特点。
美信监控易的标准产品架构图
首先,web server是美信自主研发的,用户在使用美信监控易时,只需通过浏览器访问web server即可。而实际上,美信监控易后台的典型部署方式是CCU+配置数据库+日志数据库。另外,如果是单机版的话,只会有一个TS。TS负责监测服务器、存储、网络、中间件、无线设备、摄像头、虚拟化平台和视频会议等一体化及非一体化设备。TS监测的数据会传存到历史数据库里,然后web server通过与配置数据库、CCU、日志数据库交互,把这些数据呈现出来。
在界面上看到的数据结构、添加的用户种类等,都存放在配置数据库里。CCU负责调度TS,让TS监测它从配置数据库里读取的数据(比如添加的设备、用户以及报警信息),读取数据后,CCU就会将数据分配给TS。每个TS就相当于一个任务管理器,负责采集CPU、内存、磁盘等数据。TS采集完后,会将数据放在日志数据库里。
如果需要用到历史数据来出报告,web server就会和日志数据库交互,从日志数据库里读取数据。如果添加了用户或设备,web server就会和配置数据库交互。如果需要测试或刷新动态,web server就会和CCU交互,让CCU驱使TS采集数据,这些临时采集到的数据会反馈到web server。
总的来说,当web server需要进行临时测试或执行某些操作时,它会通过CCU来驱动TS实现。
由此美信监控易衍生出了几个版本。在标准版(单机版)的状态下,会只带有一个TS,监控力度较弱;而多机版可以附带多个TS(比如在机房里部署了多个TS),监控能力则会变强。多TS、强监控能力是美信监控易的一个优势。同时,美信监控易能进行大规模监测的根本,在于可以通过一个单独的信息系统去驱动很多个TS,进而可以完成成千上万的设备监测。
另外,在默认版本上,每个TS后面都会跟一个日志数据库。web server也会通过TS的地址检测历史数据。
标准版就是单机版,如果是多个TS,那就成了多机版。架构图是简化图,实际上实现起来比较复杂——每个TS实际上可能是多个进度。
客户要访问美信监控易,所有接口都要通过web server来跟产品交互。包括第三方用户要开发一些东西,也是需要通过web server调取数据,或是通过web server把数据传进来。
总的来说,web server是一个总的对外的接口。而其下的配置数据库和日志数据库,在单机版上其实是一个数据库。虽然是一个数据库,但实际上运作时是跑了两类数据库,这两类数据库分别是key-value数据库和关系型数据库。日志数据库里的数据全部存放在表状的关系数据库里(用户、设备等数据都是存放在这种常规的数据库里)。
如果是多TS版,在默认版本的情况下,每个TS后面都带有一个日志数据库。采集到的数据会被放到本地的TS上,这样就会减少与CCU通信的概率,数据可以快速地存放。如果要出小报告,就可以从这台TS里直接取出历史数据。
如果要看监测状态,比如TS把监测状态由绿色变为红色,就会把这个状态推送到CCU上,用户通过web server就会看到监测状态变红,该报警的时候则会自动报警。所以这个实现过程是比较复杂的。
关于备份,数据库有一套默认的备份系统,用户可以指定目录,会定期对配置数据库里的数据进行备份。双设备是一套完整的机制,要求的是高可用性,即在一套系统断网的情况下,另一套系统接替工作。
监测存储的数据量跟以下方面有关。一是与监测的数据类型有关,比如监测日志,它保存的数据比较多,而CCU保存的数据就比较少。二是与监测的频率有关,频率越高,数据量就越大。而频率与设备的类型有关,不同设备之间的监测频率差别可能非常大,而且用户也会有不同的监测频率要求。所以监测数据量还是要根据用户的具体情况去分析。
监控易运维软件运行对网络性能的影响很小。因为数据库采集的数据都是字节级的,比如CCU的利用率等,对被监测主机的影响可以忽略不计,用户基本上看不到网络的状况。监测主机因为要监测大量内容,所以它是有一个监测量的。正常情况下,监测几千台设备对网络的影响还是可以接受的,都是很小的,大约产生几百k左右的流量。