作者:监控易 来源:美信时代 发布时间:2024-06-09
随着信息技术的飞速发展,在全国有多家分支机构的某企业的业务系统日益复杂,运维管理难度不断增加。为了提升运维效率,保障业务系统的稳定运行,该企业决定搭建一套统一的监控平台,以实现对云上和本地机房系统的全面监控。该平台将整合现有分散的监控系统,提供一个集中化、可视化的管理界面,帮助运维团队实时监控服务器、网络设备及应用的运行状态,确保业务的持续性和稳定性。
一、项目背景与需求
该企业目前运行着近30套系统,分布于云上和本地机房。现有的监控方式主要依靠云平台自带的监控功能,但这种方式存在监控分散、本地机房缺乏有效监控等问题。因此,多家分支机构的企业急需构建一个统一的监控平台,以实现对所有系统的集中监控和管理。
具体需求包括系统基础要求、平台技术架构、CMDB构建能力、资源分组管理能力、网络设备及链路监控能力、操作系统监控能力、数据库监控能力、虚拟化监控能力、安全监测、业务系统监测能力、告警分析能力、自定义拓扑能力、可视化大屏、智能报表、多种通知通道能力、系统管理功能、对接管理功能、审计日志功能、个人工作台功能以及知识库等。
二、解决方案与功能实现
系统基础要求:我们将选用具有全中文界面、友好直观的图形呈现的统一监控平台软件。该软件将支持对常用CPU、服务器、操作系统、中间件、数据库的监测,并针对国产化设备提供快速开发适配功能。同时,该平台将支持openEuler、Kylin等Linux发行版系统,并确保系统安全性。
平台技术架构:监控产品将采用微服务架构,内置数据库将根据数据类型采用关系数据库、时序数据库、NOSQL数据库等。平台将具备良好的可扩展性、高可用性和高性能,以满足未来更多资源监控和功能模块的需求。
CMDB构建能力:平台将提供人工录入、批量导入和自动发现功能,以快速构建资产管理模型。同时,系统能根据资源之间的CMDB关系自动生成应用部署架构图,并支持手工添加节点和图片进行修饰。
资源分组管理能力:平台将支持按实际资源运维管理维度对资源进行监控管理,如按区域、院区、组织结构等进行分组划分。同时,平台将支持多层级的分组管理能力,以及按资源分组设置权限、监控粒度和告警规则等功能。
网络设备及链路、操作系统、数据库、虚拟化监控能力:平台将支持对各类主流网络设备、操作系统、数据库和虚拟化设备的全面监控,包括端口工作状态、CPU使用率、内存使用率、磁盘使用情况等关键指标。
安全监测与业务系统监测能力:平台将与现有安全管理系统或安全设备对接,提供安全事件信息的定位、查询和统计分析功能。同时,平台还将支持对业务系统的全面监测,包括健康度、繁忙度等指标统计,以及应用拨测功能和微服务监控能力。
告警分析能力与自定义拓扑能力:平台将提供强大的告警分析能力,包括原因、影响和相关性的分析数据。同时,用户还可以根据需要自定义拓扑图,将不常关注的资源合并展示,以便更直观地查看和管理设备状态。
可视化大屏与智能报表:平台将实现智能化、可视化的运维数据中心运营管理,为运维管理决策提供重要依据。同时,用户还可以利用智能报表功能生成面向资源资产、监控告警、运维服务等维度的报告。
其他功能:平台还将提供多种通知通道能力、系统管理功能、对接管理功能、审计日志功能和个人工作台功能等,以满足用户在运维管理过程中的各种需求。
三、总结与展望
多家分支机构的企业统一监控平台的搭建将极大提升运维团队的工作效率,保障业务系统的稳定运行。未来,随着技术的不断进步和业务需求的增长,我们将持续优化和完善该平台,为多家分支机构的企业提供更加高效、智能的运维管理服务。