您的位置: 首页 > 软件开发专栏 > 系统/运维 > 正文

将AI集成到DevOps,以增强工作流自动化

发表于:2024-04-15 作者:陈峻 来源:51cto

译者 | 陈峻

审校 | 重楼

如果有人跟你说,软件开发和运营团队可以毫不费力地协同工作、简化流程,并能提高工作效率,你一定会想到那是DevOps。现如今,人们则期望它能够利用人工智能(AI)的力量,彻底改变每个冲刺、且能更轻松地协助教育新入行的DevOps专业人员。从深层次来看,无论是自动化日常任务、优化资源分配,还是预测潜在问题,人工智能完全可以对DevOps的工作流程产生革命性的影响。

下面,我将和你探讨人工智能给开发运维带来的无限机遇,揭示它将如何让团队实现前所未有的效率、敏捷性和应变能力。

如何将人工智能融入DevOps?

不可否认,目前人工智能仍在应用方面存在许多挑战,但是DevOps团队可以从如下方面思考和实施各种开放性的新用例:

CI/CD管道

人工智能使企业对其CI/CD流程实现可见性和控制力。利用人工智能,企业可以快速分析曾经构建、测试和部署的历史数据,以发现潜在的故障点,并对可能发生的问题予以预测。例如,人工智能可以分析MySQL的查询日志,以找出影响应用程序性能的低效数据库查询。

同时,人工智能驱动的系统也能主动实施预防措施,以最大限度地降低集成和部署阶段可能产生的高昂延迟、故障、以及中断风险。此外,人工智能还能协助优化CI/CD管道中的资源分配。例如,DevOps团队可以使用先进的机器学习模型(也被称为MLOps模型)来预测工作负载和资源需求。从此意义上说,由人工智能驱动的系统,完全可以动态地调整计算能力、存储和网络资源的分配。这也就确保了团队能够高效地完成构建和部署,而不会浪费宝贵的资源或遇到性能瓶颈。

预测分析

在DevOps中,预测和预防中断的能力往往意味着成功与灾难性失败之间的差别。对此,人工智能驱动的预测分析可以使团队在潜在的中断面前领先一步。

预测分析通常会使用先进的算法和机器学习模型,来分析各种来源的海量数据,包括:应用程序日志、系统指标和历史事件报告等。接着,它们可以在这些数据中识别模式与关联性,检测异常,从而对即将发生的系统故障或性能下降发出预警。据此,团队就能够在问题升级为全面中断之前采取积极措施。

此外,人工智能还能够持续分析来自各种基础架构组件(如服务器、网络和存储系统)的数据,从而在发生故障或容量受限之前,识别出潜在的硬件故障。

人工智能驱动的代码审查

手工操作往往会出现人为错误,而且耗时过长。对此,人工智能的工具能够以人类无法企及的速度分析代码库,从而快速、大规模地识别到诸如:性能瓶颈、代码不符合最佳实践或内部标准、安全责任和代码风格等潜在的问题。

同时,越来越多的工具能够为开发人员提供具有操作性的情报、以及建议性的行动方案,从而在解决已发现问题的同时,大幅降低代码库中被引入的缺陷、以及累积的技术债风险。

从更广泛的意义上说,如下模型与工具还能够提出代码库优化的措施:

上述模型已在自动化和简化质量控制等方面取得了良好的效果。通过适当地使用这些解决方案,DevOps团队可以加快交付周期,降低高昂的部署后问题风险,并能始终确保全面的质量控制。

自动安全检查

为了避免漏洞的出现,实施和执行适当的安全措施,往往可能拖慢正常的开发周期。而人工智能恰好可以为其简化流程并提高效率。由人工智能驱动的自动安全检查,与传统的静态安全解决方案不同,它具有不断学习和“成长”的能力,可以通过分析恶意行为者使用的模式和技术,来适应各种新出现的威胁。

同时,人工智能驱动的自动化安全检查功能,可以无缝地被集成到DevOps工作流中,从而在软件开发生命周期(SDLC)的所有阶段,实现持续的安全监控和验证。

反馈与优化

虽然自动化各种任务和流程是人工智能的重要组成部分,然而一个被忽视的功能是,它也能够改善运营、最终用户和DevOps团队之间的反馈回路。由于擅长筛选大量数据,因此这些工具成为了分析诸如:系统日志、用户行为、应用性能指标、以及最终客户的直接反馈的理想工具。

此外,这些工具也可以使用自然语言处理(NLP,Natural Language Processing)和机器学习来确定模式和趋势,从而指出应用程序在性能、可用性和整体用户满意度等方面需要改进的地方。而且,这种智能分析使得开发团队能够根据真实的用户需求和系统性能,来确定修改和增强的优先次序,从而使产品能够更加符合用户的期望,并能按照实际情况运行。

将人工智能融入DevOps的工具和技术

人工智能与DevOps的集成催生了一系列旨在提高自动化和效率的工具。虽然许多组织可能会默认选择热门的谷歌云(Google Cloud),但越来越多的DevOps团队已开始寻找其替代品,以发掘那些由人工智能赋能的、价格更优惠、且更适合特定工作流的服务。例如,甲骨文和阿里巴巴云在该领域已越来越受欢迎,其人工智能功能正在逐月迭代。

代码审查和质量保证

我们可以考虑使用DeepCode、Codacy和SonarSource等解决方案,利用机器学习算法来分析代码库,找出潜在的漏洞、代码缺陷、以及违反最佳实践的情况,进而优化现有的代码分析和审查流程。

而在测试和质量保证方面,Applitools、Functionize和Mabl等人工智能驱动的工具,可以通过可视化机器学习技术,自动创建和执行测试。当然,如果你选择使用本地托管的大模型则可能需要通过专门的培训,才能使其专门从事DevOps任务(尤其是CI/CD)。

另外,在基础架构管理和监控方面,Moogsoft和Dynatrace等人工智能增强型平台,可以提供先进的异常检测和根本原因分析服务,通过实时分析运行数据,以预测和预防潜在的系统故障。

面向非技术人员的DevOps工具

目前,一个普遍的误解是,人工智能驱动的DevOps工具,只是那些拥有庞大资源和复杂软件开发需求的大型企业的“特供”。其实并非如此。由人工智能赋能Harness和CodeGuru等解决方案,以其灵活性非常适合较小的团队。事实上,小型IT团队往往处于持续满负荷运转的状态,这意味着他们需要在DevOps任务中,采用各种开源的、可根据其特定需求定制的人工智能工具。

将人工智能融入DevOps的优秀实践

随着将人工智能融入DevOps实践的势头不断增强,企业可以通过如下优秀实践,来充分释放人工智能驱动的DevOps自动化的全部潜力,以减轻潜在的挑战:

  • 确定明确的目标和衡量标准:团队首先要确定通过在DevOps周期中整合人工智能所要实现的具体目标。无论是提高部署频率、提升代码质量、降低故障率,还是加快事件响应时间,明确的目标都有助于团队选择恰当的人工智能工具和技术。
  • 从小处入手,不断迭代:与其尝试对DevOps流程进行全面改革,不如先确定人工智能可能带来直接价值的具体领域。团队应从试点项目或概念验证开始,随着经验和信心的积累,再逐步扩大人工智能的集成。
  • 确保数据质量和管理:由于人工智能算法严重依赖于数据,因此团队必须及时建立健全数据治理实践。只有切实保障了数据的质量、完整性和可访问性,实施数据清理、验证和管理等流程才会变得更加容易。

总结

综上所述,人工智能已日益融入更广泛的DevOps框架中,并给DevOps的日常处理方式与效率带来重大的变化。特别是在CI/CD方面,由AI赋能的预测分析将帮助DevOps团队在保持领先的同时,不断改变客户服务管道和优化资源分配。我们可以毫不夸张地说,企业若想有效地获得竞争优势,将人工智能融入DevOps不仅是一种可能性,更是一种必然选择。

译者介绍

陈峻(Julian Chen),51CTO社区编辑,具有十多年的IT项目实施经验,善于对内外部资源与风险实施管控,专注传播网络与信息安全知识与经验。

原文标题:Next-Gen DevOps: Integrate AI for Enhanced Workflow Automation,作者:Alexander T. Williams