云计算是一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按照“即插即用”的方式,将计算、存储、网络等IT基础设施,以及其上的开发平台、软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通过公众通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和应用服务,用户按实际使用数量进行付费。
以云计算服务为核心的数据中心运维管理,是一种新型的管理理念,数据中心运维管理是数据中心生命周期中最后一个也是历时最长的一个阶段,从前期应用架构设计、软硬件资源配置评估、应用服务性能瓶颈评估到安全防护和系统优化等工作,都需运维人员全程参与。
云计算服务的运维管理集中体现在对云计算服务生命周期的管理。服务的生命周期在IT服务的标准ITlLv3中有明确定义,其核心架构是基于服务的生命周期。服务的生命周期以服务战略为核心,以服务设计、服务转换和服务运营为实施阶段,以服务改进来提高和优化对服务的定位及相关的进程与项目。
IT运维领域迫切需要对以云计算为核心的下一代数据中心提供更好的运维支撑解决方案,将各种先进的运维管理技术进行有效的整合,对新增虚拟网络、数据存储、虚拟机、宿主机、集群对象采用全新管理方式,从日常监控、周期巡检、服务受理、故障处理、平台维护、配置管理、安全管理等方面着手,利用自动化运维工具,实现对物理资源、虚拟资源统一管理,提供资源管理、统计、监控、调度、服务管控等端到端的综合管理能力,从而实现对云数据中心统一、便捷、高效、智能的一体化运维管理。
业务导向放首位
根据国家标准化管理委员会下发的文件,运行维护服务是供方依据需方提出的服务级别要求,采用相关的方法、手段、技术、制度、过程和文档等,针对运行维护服务对象提供的综合服务。为确保提供的运行维护服务符合与需方约定的质量要求,供方应具备实施运行维护服务的基本条件和能力。
云计算体系下的运维目标首先应该以业务为导向,如新业务的快速部署、系统容量的平滑扩容、随需而变的资源分配等,保证服务达到要求的等级标准,根据业务目标形成IT服务的管理目标。其次通过自动化的运维工具完成系统预备、配置管理以及监控报警等功能,降低故障发生率,提升故障发生后的响应处理效率,实现业务的快速恢复。最后通过改进运行维护服务能力管理过程中的不足,持续提升运行维护服务能力。
打造智能化运维管理模式
数据中心需要建立集中高效、性能优质、快速响应的智能一体化运维生产管理模式,对数据中心的网络、系统、设备、设施,实行集中监控、集中IT平台支撑、垂直专业管理、统一运行调度。建立合理的运维服务管理制度,包括完善的管理组织结构、明确的岗位职责、人员素质能力要求、工作流程和管理制度。建设智能集中监控信息化平台,包含集中动环监控系统、集中网络监控系统、集中电子运维系统、集中IT运营支撑等系统,实现可用性、安全性和预警控制。建立降本增效、绿色节能的效益管理模式。
为保证故障响应、解决问题和交付结果可控,供方应在人员管理和岗位结构以及人员的知识、技能、经验、安全意识等方面满足所需水平,组建掌握网络、动力、安全、消防、IT软硬件等核心专业技术的运维支撑队伍。
云计算技术将为运维体系带来新的理念,通过一体化、自动化、智能化的IT系统,将传统运维工作中的大量简单、重复性的手工工作通过软件实现,使运维人员有更多精力、条件,投入到整个服务生命周期当中。IT运维服务企业需要构建完善、成熟的IT运维服务体系,从制度、流程、人员、技术、资源等方面入手,不断提高IT运维质量,实现高效运维。