介绍
什么是NOC?
NOC(网络运营中心)是远程实时监控服务运营和检测设备状况的网络化中心,主要用于管理大型且不断变化的网络基础架构、提供网络环境的检测、维护、管理、技术服务等。NOC通过技术、流程、组织和管理的效率来提升网络与服务的稳定性与可预见性。NOC是维护客户体验质量的神经中枢与展示中心。
架构
网络运营中心一般由三大中心(网络服务中心、指挥调度中心、展示体验中心)立体化构成。
NOC的系统组成包括以下四个部分:
1、 基础环境支撑系统:包含装饰、安控、强电、基础网络和消防等。
2、 日常业务呈现系统:包含显示终端、显示终端间(大屏、监视器)的呈现软件、辅助AV等。
3、 指挥调度系统:分为可预见调度和非可预见调度,设计相应的基础支撑环境
4、 综合展示和体验系统:包括展示区域、展示软件等。
产品
金盾NOC网络运营中心系统
Network Operation Center System 网络运营中心系统(简称NOC系统)。该产品依托于大数据和云计算技术,采用HBase 和 MySQL双数据库引擎,刀片式服务器集群架构,实现全面的 IT 基础架构监控,网络拓扑可视化管理,网络资源全面化数据采集,网络资源事件和告警信息的集中展示、智能联动,TB 级海量日志信息的全文搜索、秒级查询、数据挖掘等功能。帮助单位对所有设备进行统一管理,实时了解网络承载的业务,全面掌握网络质量,实现轻松高效运维,为单位运营管理提供整体化平台解决方案。
产品概述
全面运维管理 海量运维数据存储 智能挖掘 B/S架构 旁路部署
依托云计算技术,稳定高效的运维管理平台
NOC系统平台的部署完全采用刀片化、模块化和集群化的部署模式,整个系统由NOC一体化应用服务器、Hbase数据库集群和Mysql集群组成,Hbase数据库集群主要存储分钟级和秒级的性能数据以及海量的日志数据,Mysql数据库主要存储常规数据以及经过分析计算后的数据。整个集群既可以放在一台NOC刀片服务器上部署,也可以分布在多台NOC服务器上,是一款稳定高效的运维管理平台。
全面的IT基础架构监控
NOC系统兼容华为、华三、思科、锐捷、迈普等多家厂商,支持网络设备、服务器主机、虚拟化设备、存储设备、安全设备、无线设备等各种资源设备, 用户可轻松实现全面的IT基础架构监控和统一管理。
丰富的运维管理监控策略
NOC系统平台根据多年运维经验,内置监控管理策略,进行全网各类IT资源的数据采集分析和联动处理。不仅能够帮助客户快速定位故障原因,快速排除故障,还能参考历史数据和异常变化阈值提高对故障预警检测的准确性。
运维信息的可视化展示
NOC系统平台实现网络结构、各类核心IT系统结构以及运行态势的可视化、图表化、透明化。让客户对当前全网IT系统运行情况一目了然,实时掌控各类IT系统的运行态势。
全网资源的自动检测,智能响应
NOC系统平台除了通过主动轮巡方式对网络、服务器、存储系统的主动监测外,还能通过日志等被动监测手段全面监控系统运行的方方面面信息。实现对网络等IT资源管理的自动化管理,能够自动巡检和发现IT系统中存在的各类问题,非常规问题能够通过短信、邮件、语音等方式快速通知客户处理。
海量运维数据存储、智能挖掘
NOC系统平台实现对各类运行数据、日志数据的存储和分析挖掘,通过对TB级海量数据的存储、分析和处理,形成对客户有价值的决策数据,为客户在系统容量规划、中长期的系统运行态势预测方面提供有力的数据支撑。
产品功能
全面展示全网系统健康运行状况:首页从不同角度全面直观的展示全网业务系统的运行状况,既能宏观的展示系统的整体健康状况,还可以显示系统关键资源运行状况,实现精细化运维。
统一的拓扑展现中心:对于客户所有的IT资源建立以统一拓扑为中心的展示模式,融合用户的网络视图、主机视图、存储融合,完整展现用户统一的IT架构,让用户全局掌握IT系统整体的运行情况。金盾NOC平台的建设将消除管理对象之间的差别,对各种不同数据来源统一处理、统一展现、统一用户登录、统一权限控制,从而为运维管理建立统一的管理视角。
丰富的一体化监控策略:实现对主机、网络、服务器、存储等各类IT系统的统一监控。自动实现对复杂异构的IT资源环境(网络设备、安全设备、服务器硬件、存储、机房环境、操作系统、的设施运行状态监(面向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制)一体化。
智能化的情报预警处理中心:实现主机、网络、服务器、存储等各类IT系统各类故障的统一自动判断,统一汇总展现、统一通知相关处理人员,自动对系统运行情况做出评估,系统能够记录和展现报警发生的时间、事件信息、事件分类、处理状态、处理评注及建议等功能,使运维管理人员清楚了解系统故障的处理状态,及时掌握系统运行的故障和警报,及时进行处理,保障系统的正常、稳定运行。
强大的运维大数据分析中心:实施收集记录各类性能的结构化数据和日志等非结构数据,通过回归、分类等机器学习算法,通过报表的灵活性和多样性能满足用户不断变化的需求。通过它能够有序地展现网络运维的所有管理指标,生成各种分析报告和图表,全面地呈现网络系统的设备资源、告警统计、系统运行状况等,为故障诊断、领导决策提供科学的、可量化的决策依据。
开放、具有良好扩展性的IT管理平台:监控管理平台具有很好的开放性,具备与相关系统的集成能力。监控管理平台具有良好的扩展性,不仅可以满足现阶段客户管理的需要,未来,随着业务的不断发展,监控功能添加,或管理节点数量增加时,监控管理平台也可以很好满足该客户的需求。
应用价值
1、全面提升管理效率和管理的规范性
通过自动化、智能化和透明化的管理平台和监控平台,运维管理人员既可以从高度总览全局,也可以直达一线,透明化的运维过程使得管理人员既可以对运维效率、质量有总体的掌控了解,也可以对运维个体进行数据分析,从而全面提高管理能力和水平,提升对运维体系全局管理能力。自动化的监控工具深入监测系统运行状态,既可以实现对IT系统的实时巡检,实时发现各类故障,也可以对问题进行自动化预处理。这些自动化和智能化工具平台使用,再结合ITIL最佳实践,可以实现人、技术和流程的高度融合,提升解决问题的能力和效率。
2、面向业务和IT基础设施
层次化业务管理:层次化展现业务系统结构,建立自上而下的从业务到资源的管理机制,实现业务隐患早发现的管理目标。
全面的系统资源管理:提供对网络、主机、存储设备、安全设备、IT资源的全面监控管理。智能化的故障管理:自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理。
性能管理与优化:对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为业务及资源性能优化提供科学依据。
3、面向维护管理者
将人、技术进行有效地融合,实现日常运维工作的自动化、信息化和标准化。实时展现当前IT系统的运行状态及趋势,帮助管理人员快速发现问题,分析和确定问题所在。
4、面向领导决策者
综合报表:对系统运行状况的信息进行汇总,基于大数据的分析和处理技术,帮助管理人员更全面的了解IT系统的运行状况和趋势,为决策提供科学依据。
规范运维过程:实现对运维工作的可查询、可跟踪、可掌控,提升运维人员解决事故隐患的能力,规范化管理,降低运维成本。