您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 系统/运维 > 正文

浅谈科技运维一线工作的数字化转型

发表于:2023-08-29 作者:吴凌兰 来源:匠心独运维妙维效

引言

    G行始终践行“以客户为中心”的服务理念,通过科技赋能,不断优化业务流程,逐步实现数字化转型,提升对业务的服务支持,推动业务高质量发展。对于科技运维工作,是否也可借助数字转型赋能一线,在促进高质量发展的同时推动降本增效呢?

运维数字化转型的机遇

    G行运维一线成立于2009年,在1.0时代,主要负责生产系统监控及批量手工操作。此时监控工具分散,批量工作需双人复核手工执行,告警后运维一线技术水平有限,独立处置水平较低,运维二线人员夜间呼起率较高。

    伴随G行技术平台的发展,运维一线工作内容进一步扩充,进入2.0时代,主要负责生产事件处置、事件通知通报、科技服务请求受理、安全权限管理等。依托统一监控管理平台,总览生产系统运行情况;依托批量自动化平台,日均调度14000余个批量任务;依托新一代运维自动化操作平台、IT服务管理系统等,事件及服务请求独立处置率为62%,运维二线夜间呼起率大幅度下降;依托综合管控平台、机房巡检智能管理系统、系统用户维护管理平台,实现物理安全管控、生产服务器用户权限管控。但由于运维一线在应用、系统、云、网络、安全管理等领域涉及使用的平台及产品已达数十个,部分平台和产品间无法互联互通,彼此形成信息孤岛,需要运维一线人工进行串联,造成运维一线工作中如下痛点:

    1、信息分散,需人工跨平台拼凑数据链,信息采集效率较低,通知通报效率较低;

    2、系统上云程度高,交易复杂场景多,并发通报效率较低;

    3、人工执行结果存在差异。

图片图片

运维数字化转型的目标

    基于以上痛点问题,G行建开展科技运维一线工作台项目建设工作,打造运维3.0时代,将科技运营过程中的平台、流程、数据进行整合,重塑业务流程,整合科技服务能力。

    数字化的基础在于连接,本项目将现有场景的业务需求提取最大公约数,整合现有工具平台、业务流、数据流资源,合力提升信息收集和通知通报效率,从而解决上述问题,提升运维一线人员的服务能力和服务效率。

图片图片

运维数字化转型的落地

    数字化转型项目的开展一般采用明确业务需求、深入挖掘痛点、针对性设计数字化场景解决方案的形式。本项目完整梳理了G行运维一线的工作内容、操作平台、业务流程、痛点及风险点,以“数据协同、功能复用、业务场景驱动”为建设理念:

    1、将生产系统配置项信息、维护人员信息及各类科技运营信息进行整合,实现生产系统数据整合,可快速提供运营所需数据;

    2、实现数字化外呼功能、信息采集模板定制化功能、内部通讯软件信息推送等功能,可结合不同业务场景,通过本平台进行原子化配置,提升工作效率;

    3、将运维一线业务场景标准化,聚合数据与平台优势,实现场景数字化、自动化,弥补人工执行差异。

运维数字化转型的效能提升

    数字化转型有力提升了运维一线工作的自动化水平,提升了运维一线在信息收集、通知通报等方面的效率及标准化程度。以下以运维一线每日基本工作事项为例,阐述本平台对运维一线工作效能的提升效果。

信息采集场景化、自动化,提升信息收集效率

    为保证每日安全运营情况在科技板块内高效流动,运维一线每日汇总事件、变更、容量、安全等领域的情况,通过“晨汇报夕总结”的形式,对重点关注内容及风险隐患进行提示。运维一线每日需收集16项晨会汇报内容、12项安全运营情况总结汇报内容。除总结汇报,每日需对安全运营情况进行巡检及多次、定时通报,如开门检查结果通报、互联网带宽流量检查结果通报等。人工采集信息存在效率较低、容易出错的问题,定时通报存在受人工影响造成延误的问题。

图片图片

    本平台将G行的IT服务管理系统、容量系统、科技运营数据平台等平台数据整合,建立晨会场景,每日自动汇总生成日报,将人工收集项降低至3项,实现晨会汇报内容电子化;建立安全运营情况汇报场景,将人工收集项降低至4项,提升信息收集效率及准确性;建立安全运营巡检场景,结合RPA技术实现自动化巡检,配合定时任务调度配置,实现巡检结果定时发布。提升信息收集能力、通知通报能力、安全运营能力,减少人因操作风险。

图片图片

填补数字洼地提升告警通报效率

    为保障告警信息通报及时,运维一线根据统一监控平台及处置预案对相应管理员进行人工外呼,日均外呼248通电话。由于监控告警信息、系统与管理员的关联关系、管理员联系方式、告警处置预案分散在不同平台,运维一线人员在梳理完整信息链后,通过固定电话进行人工外呼,效率较低;伴随系统上全栈云数量逐渐增加,多系统集中告警场景需统筹各系统、各领域管理员迅速集结处置,人工并发通报效率较低。

图片图片

    本平台将G行外呼平台、外呼通报规则、告警信息、人员信息进行整合,在数据及时更新可用的前提下,以统一监控平台为操作平台,实现告警一键外呼、并发外呼功能,帮助运维一线将外呼通报能力由分钟级提升至秒级,单系统外呼效率提升83%,多系统并发外呼效率提升95%,实现通报能力跃迁。同时,本平台设置外呼对象除重机制,在保证通报准确到位的同时减轻管理员的压力。

图片图片

运维数字化转型的展望

    数字化转型既是需求的驱动,也是技术的进步和成熟的体现,更能带来降本增效的作用。G行的科技运维一线工作已经进入3.0时代,工作内容逐步由简单手工操作转向更为复杂的事件初步分析、部分事件独立处置等领域,需为安全运营提供更为有力的支撑,这就需要运维一线人员不断地学习新技术,掌握先进工具和方法,以适应发展趋势,提升安全运营能力,将人工操作向标准化、自动化、敏捷化方向转型。相信通过不断提升自主研发能力、优化运维流程,进一步推动数字化转型,科技运维一线工作台项目将助力G行安全运营工作的开展,为G行的金融科技发展保驾护航。