在中国信息通讯研究院与中国通讯企业协会配合主办的第二届“更始杯”数字化转型利用年夜赛中,北京移动和嘉为蓝鲸结合申报的“北京移动云计较智能运维平台扶植项目”,从两千余个申报案例中脱颖而出,终究荣获年夜赛二等奖。
中国移动通讯团体北京有限公司(下称北京移动)成立在1999年,附属在中国移动通讯团体公司,秉持“正德厚生,臻在至善”的企业焦点价值不雅,慎密环绕“做世界一流企业,成为移动信息专家”的计谋定位,以出色品质铸造一流信息办事,用立异精力尽力实现从优异向出色的新逾越,出力鞭策“移动改变糊口”。
1、初探主动化,转型亟需新动能
自成立以来,北京移动始终连结行业信息化领跑者的身份,对峙“以寻求出色,让数字化糊口更夸姣”为任务,自愿成为“客户首选的数字化办事的引领者”。为快速响应营业需求,IT团队前期从手艺平台扶植切入,利用开源软件搭建了根本的主动化运维系统,实现了剧本和文件的批量主动化,但仍存在如设置装备摆设数据笼盖不全、功课履行管控手段欠缺、运维场景化能力不足、手艺架构相对简单等问题。
为晋升系统不变性,保障营业不变运行,北京移动联袂嘉为科技旗下研运品牌嘉为蓝鲸,打造智能运维平台,扶植设置装备摆设数据治理、监控治理、日记治理、同一告警治理、主动化巡检、运营办事报表等运维场景,实现治理流程立异,完美智能运维能力,向着具有营业价值的运维模式迈进。
2、“平台+利用”,高效扩大利用场景
经由过程PaaS平台+SaaS场景的体例构建一体化运维治理系统,1个根本平台融会了公共能力,支持场景利用的运行、协同、办事。场景利用包罗了设置装备摆设治理CMDB、IT监控诉警、日记平台、主动化巡检、运营办事报表等5年夜利用,后续可快速、矫捷扩大各类利用。
1、平台范围:当前出产情况按撑持纳管200+节点办事器,纳管8套利用系统,摆设运行16个运维场景东西;
2、平台集成:与4A系统集成对接,与邮件系统集成实现动静通知;
3、同一管控:采取管控平台纳管分歧收集区域的主机。
3、提速运维效能,保障营业不变运行
1、CMDB主动收集,资本同一治理
构建云运维基石CMDB,实现资产数据的集中治理,为利用供给各类运维场景的设置装备摆设数据办事。经由过程供给设置装备摆设治理办事,以数据和模子相连系映照利用间的关系,包管数据的正确和一致性;并以整合的思绪推动,终究面向利用消费,阐扬设置装备摆设办事的价值,实现IT资本集中规范化治理和消费。
·云平台A建立模子涵盖主机、营业、云虚拟资本、平安装备、根本举措措施、收集、办事器、云平台等共30+个;同时完成VMware、华为云资本的接入;纳管主机120+、接入营业6个;设置装备摆设发现设置装备摆设收集使命运行次数270+;
·云平台B建立模子包罗数据中间、机房、机柜等总计30+个,完成模子数据录入;
·主动收集录入虚拟机实例近1600条,计较办事器160+条,存储办事器110+条,虚拟资本卷1200+条。
2、海量对象纳管,一体化监控进级
基在平台丰硕的数据收集、数据处置和插件扩大能力,集成现有监控平台,实现对各类收集装备、主机装备、存储装备、中心件、数据库、要害利用历程的监控诉警。经由过程集中治理告警信息,并采纳同一的收敛、屏障、联系关系阐发、主动化处置等手段提高告警有用性,削减误告与漏告,实现告警从接入、收敛、处置、分拨的闭环治理,晋升了告警处置效能,保障系统不变运行。
·监控接入:纳管4个营业系统,总计120+台主机监控、4个收集端口拨测监控、20+个历程监控,3个自界说剧本监控,总计70+个监控指标;
·告警接入:告警接入华为云、Zabbix、VMware等13个告警源,完全笼盖1、2层硬件监控,3层监控笼盖4个营业系统。
3、日记联动告警,收集健康随时保障
完成日记监控数据告警设置装备摆设,可经由过程收集装备的日记数据阐发来获得收集装备健康状况,同时,对收集装备的日记级别进行数目统计和监控展现面板。共接入70+个收集日记数据源,建立10个收集使命接入使命,5个收集日记数据仪表盘,3个日记要害字告警使命。
4、巡检主动化,平安提防更高效
经由过程自界说巡检剧本和剧本对象,进行和时性、周期性等巡检工作的主动化履行,替换运维人员平常手工巡检,可按照分歧运维脚色,自界说分歧的巡检工作打算,并生成尺度可视化陈述。辅助运维团队周全领会各类软硬件资本的出产健康状况,从全量的出产系统中提早发现隐患,保障营业不变性。
·巡检模版:完成4个尺度化主机巡检剧本,Linux巡检模版3个,各类巡检指标62个;
·巡检使命:设置装备摆设巡检使命3个,32个主机巡检对象。
5、数据可视化,IT运行全把握
北京移动本来并未利用专门的报表东西,用Excel手工记实资本资产信息,工作量年夜且时效性低,正确率也难以包管,建造、保护、查看均不便利。本项目基在蓝鲸平台,打造了一款轻量级、可自立阐发的报表建造东西,实现对各类数据源的接入,帮忙运维人员全方位把握IT资本的运行状况和资本利用环境。
·云平台A:完成对接华为和VMware数据接口获得数据。在运营办事报表中建立华为报表数据源9个,VMware数据源7个,建造华为运维报表8个;建造VMware运维报表5个,包罗日报,周报和月报,并实现字段挑选展现报表数据;
·云平台B:完成5个数据文件的解析,并封装为报表数据源接口,并按照需求生成5个种别共8张主动化运维报表,可按照时候或对象名称进行挑选展现。
在数字化转型海潮中,北京移动率先出击,打造了面向云计较运维场景的智能运维平台,推动更邃密化、主动化、智能化运维系统扶植,强化系统风险和故障的早发现、早定位、早措置,保障营业不变运行,并扶植完美的运维开辟能力,实现从传统运维向运维开辟的转型。
责任编纂:刘明德