为了积极应对新冠肺炎疫情,分享数据中心各领军企业在疫情期间顺利保障数据中心安全稳定运营的实践经验,规范化管理、科学化防控,推动整个数据中心行业的健康发展,由中国通信企业协会云数据专委会主办的“线上论坛”在这个特殊时期以我们互联网人最熟悉的方式,在“线上”顺利举行。中国电信、中国联通及行业各知名专家、学者在论坛期间积极参与,踊跃分享。3月4日下午,作为中国领先的云计算数据中心服务提供商,云数据专委会的常务理事单位,数据港应邀出席本次“线上论坛”,副总裁兼首席架构师张永炼从数据中心服务商的角度分享了“新冠疫情下的数据中心运维防控策略”,得到了“在线”各界的高度好评。
数据港从1月22日起,就进入到1级应急响应状态。在反应速度上,第一时间成立疫情防控工作小组,统一指挥、统一部署;在全面防控上,从人员信息统计、到各区域隔离防控、人员分级防控,做到了严防死守,全方位把控;在细节处理上,从防疫知识宣贯、落实各项防疫保障物资,再到细化各应急响应机制、人员排班安排、智能化运维等细节方面,做到了层层部署。在疫情防控期间,有力有序地为数据中心的安全稳定运营、客户业务的顺利开展、员工和凯时国际的合作伙伴的生命健康安全提供了全面保障。
疫情的爆发,使数据中心智能化运维的作用在解决人员紧缺和保障运维目标的矛盾中作用凸显。在疫情防控期间,数据港自主研发的“运维管理大数据分析技术”发挥了明显的智能化优势。
“运维管理大数据分析技术”是数据港多年运维管理理念的“积淀”,开发过程始终以itil标准为指引,同时参照了数据中心行业的的相关体系标准(gb50174、uptime tier、m&o、数据中心运维成熟度模型等),实际应用中搭建了八个功能模块进行细化管理和数据采集,分别是安全管理、人员管理、作业管理、成本管理、供应商管理、客户管理、计费管理、设备管理方面,使得设备的事件预警、人的行为监测、能耗的动态分析一目了然。自动生成真实组网拓扑图,24h监测故障及小程序自动告警推送,第一时间通知运维人员故障的原因、故障所在的位置,实现了数据中心现场运营的“监、管、控、营”。在日常工作中,它帮助排除了更多的人为判断和干扰,从一定程度上减少了运维人员的工作量,为解决人员紧缺情况下顺利保障数据中心安全平稳运行提供了强有力的凯时娱乐的技术支持。同时,它在减少灾难性宕机、数据丢失以及其他共性问题,提高系统稳定性和安全可靠性方面,起到了关键性作用。也正因如此,使得数据港自成立以来从未发生过任何宕机记录和违反sla的情况,为数据中心行业向智能化运维方向的发展提供了有力的实战借鉴经验。