混合云为企业保护应用程序免受故障和灾难的影响提供了一个新的机会。
对于某些应用程序来说,由于多种原因,私有云仍然是不错选择。对于一些企业来说,公共云已成为功能更强大且更具成本效益的一种选择。其结果是采用一种混合云体系结构,可以获得一些可能带来效益的新功能。其中一项功能涉及利用混合云中提供的额外灵活性和可扩展性,以实现不同应用程序所需的不同高可用性和灾难恢复保护,而无论它们在哪里运行。
本文从高可用性(HA)和灾难恢复(DR)的角度研究混合云,并提出一些使配置更具成本效益的建议。如果谨慎使用混合云,则可以通过维护多个企业数据中心来实现强大的高可用性(HA)和灾难恢复(DR)保护,从而节省大量成本。当然,那些不需要这类保护的不太重要的应用程序也可以成为全部或部分迁移到公共云的选择。
多云的条件
云计算服务提供商(CSP)已实施了运营商级的基础设施,以使公共云具有更大的弹性,而这种弹性远远超过了企业所需要的任何弹性。每个数据中心都存在一定的冗余性,在全球范围内的每个云区域和可用性区域都存在多个数据中心,这些都给云计算提供了前所未有的可扩展性和可靠性。但是,故障可能也确实会发生,其中一些故障会导致客户停机,而这些客户没有为其应用程序确保高可用性而制定特殊规定。
在其服务等级协议(SLA)中,所有云计算服务提供商(CSP)对“停机时间”的定义有些不同,并且都排除了应用程序级别停机的某些原因。实际上,服务等级协议(SLA)仅保证虚拟机(VM)或物理服务器在跨多个可用性部署两个或多个实例时,至少一个实例具有到外部网络的连接。
以下是不包括在服务等级协议(SLA)中的三个常见的停机原因示例:
- 错误的行动,或在需要时缺乏行动(包括人们不可避免地犯下的错误);
- 客户的软件或第三方软件,其中包括应用程序软件(例如SQL Server或SAP);
- 云计算服务提供商(CSP)无法合理控制的因素(包括运营商网络中断)。
另一个限制是云中缺少存储区域网络(SAN)或其他形式的共享存储。在旨在解决这个限制的所有选项中,专用的SANless故障转移集群能够满足Windows Server和Linux的所有关键任务应用程序最苛刻的恢复时间和恢复点目标。SANless故障转移集群软件可在私有云、公共云和混合云中运行,其检测应用程序和数据库级别故障的能力消除了云计算服务提供商(CSP)的服务等级协议(SLA)中排除停机所造成的差距。
高可用性(HA)/灾难恢复(DR)混合云
混合云的一个常见配置是让公共云为在私有云中运行的应用程序提供灾难恢复保护。这种安排非常适合只有一个数据中心的企业,并且可以用于所有应用程序,无论它们是否具有高可用性(HA)保护。由于SAN可以部署在企业数据中心中,因此可以使用传统的故障转移集群进行高可用性(HA)保护。然而,考虑到SAN的高成本,许多组织现在选择使用SANless故障转移集群解决方案。
一种常见的配置将无SAN故障转移集群用于高可用性(HA)和灾难恢复(DR)保护,高可用性(HA)在私有云中,而灾难恢复(DR)在公共云中。对于只有一个数据中心的企业,这种配置是理想的选择,并且具有单个高可用性(HA)/灾难恢复(DR)解决方案可简化实施和持续管理。建议在企业数据中心中使用单独的机架,以提供额外的弹性,并建议在公共云中指定一个远程区域,以更好地防御广泛的灾难。
值得注意的是,微软公司和亚马逊公司现在都已经管理了灾难恢复即服务(DRaaS)产品:分别是Azure Site Recovery和CloudEndure Disaster Recovery。这些服务支持示例中的混合云配置,并且价格合理。但是这种安排通常不支持复制集群应用程序,并且存在一些带宽限制,从而妨碍了它在许多应用程序中的使用。
优化混合云价格/性能的其他方法
以下是一些其他建议,用于管理云中的资源利用,这些方式可以降低成本,同时为所有应用程序保持适当的服务级别,包括那些要求关键任务的正常运行时间和高吞吐量的应用程序:
- 合理选择资源利用率以实现优秀性价比,尤其要注意成本最昂贵的计算资源。
- 对于现有应用程序,在不断监控性能的同时逐渐减少分配,直到获得递减的收益。
- 对于新应用程序,从用于计算的最小虚拟机配置开始,仅根据需要添加CPU内核、内存和I/O以获得令人满意的性能。
- 存储在云中的成本相对便宜,但是请谨慎使用价格低廉的存储设备,因为I/O可能会给某些服务带来单独的、成本高昂的费用。
- 如果可用,使用可能更具成本效益的性能增强技术,例如分层存储、缓存和内存数据库,以帮助优化配置。
- 考虑通过将应用程序从Windows Server迁移到Linux,以及从企业版的SQL Server的Always On可用性组迁移到标准版的故障转移集群实例来降低软件许可成本,这两者都可以通过使用SANless故障转移集群来实现。
- 利用所有可用折扣,例如预付费服务或延长服务承诺。
对云计算的信心
云计算的弹性,运营商级基础架构使其能够为企业应用程序提供运营商级的高可用性(HA)/灾难恢复(DR)保护。使用无SAN故障转移集群解决方案可增加运营商级的高可用性,但没有运营商级的价格标签。易于实施和操作,再加上集群对云计算、存储和网络资源的有效利用,很大限度地降低了持续成本,并提供了可靠的高可用性(HA)和灾难恢复(DR)保护,其价格比以往任何时候都更加经济实惠。