您的位置: 首页 > 软件开发专栏 > 网络/安全 > 正文

通过AIOps进行网络管理的常用方式

发表于:2021-08-02 作者:李雪薇 来源:ITPUB

企业的NetOps团队面临着筛选大量传入数据以识别出现在网络上的技术、性能和安全问题的挑战。这在传统上是一个手动的、耗时的过程。现如今,NetOps团队正在优先考虑有助于识别问题和快速修复问题的解决方案--AIOps就是解决方案之一。

AIOps使用人工智能来发现和理解模式,并在大型、复杂的数据集中识别异常情况。根据Gartner的说法,"AIOps结合了大数据和机器学习,使IT运营过程自动化,包括事件关联、异常检测和因果关系确定。"

虽然AIOps可以做很多事情,但最近的研究表明,企业正在优先考虑有助于快速识别潜在网络问题(如异常检测/智能警报和升级)的用例,并尽快修复它们(如安全事件和IT服务问题的自动修复)。

为了进一步探讨这个话题,让我们深入研究EMA最近的一些研究,评估AIOps的使用和看法,并看看AIOps驱动的方法如何能使NetOps团队受益。

研究:确定应用场景的优先级

当谈到AIOps时,EMA的研究表明,企业明显优先考虑直接关注保持网络安全和高效运行的场景。例如,56%的企业正在优先考虑或实施异常检测,这涉及暴露异常活动或正常参数之外的操作,使其成为AIOps的首选。

此外,人工智能(AI)可以被训练来快速区分真正威胁到网络运营的异常现象,帮助团队将精力集中在最需要的地方。

举例来说,当带宽消耗出现异常峰值时,企业需要定义策略,从通常的月度趋势中检测异常情况,可以跟踪这些异常情况,并将其缩小到企业空间已知或未知的某些网络服务或应用程序。这种情况通常发生在计划外的服务器或数据备份,或某些应用程序(如大型文件传输或流)的BW使用期间。

当涉及到安全事件时,目标是尽快消除威胁。根据EMA的数据,在对安全事件的初始响应中所涉及的大部分内容可以很容易地实现自动化,只要规则正确,这种自动化的安全事件补救是企业的第二大优先用途(55%)。

自动化的初始安全响应不仅可以加速解决问题,还可以让团队更紧密地关注那些需要直接人工干预的领域。围绕自动化安全事件和补救的一个常见场景是,当一个未知的应用程序或主机/IP被标记并使用了网络资源、服务或企业带宽。企业外的主机可以被标记和列入后备名单,并在此过程中使用访问列表进行隔离。

处理大量的警报

如前所述,NetOps和SecOps团队每天都面对大量的警报,可能隐藏着严重的操作或安全问题。由于人工智能擅长模式识别,智能警报/升级(53%)是企业的第三大优先使用的场景。

根据网络安全漏洞的类型和级别,可以设置服务策略来提醒或升级这些问题。团队还可以配置基本警报和黑名单,以便将来对简单的网络异常情况进行分析,这可以阻止通过服务策略定义的未识别的流量模式。

与安全事件的补救类似,在IT服务中自动缓解问题的过程会加快MTTR,确保运营效率。这使得自动化IT服务问题修复(52%)成为企业第四大优先考虑的AIOps使用场景。

为了解决这个问题,团队可以通过适当的警报机制,根据服务级或应用级事件定制强大的事件管理策略(这正成为企业的重要优先事项)。同时,需要对不同事件的记录、跟踪和管理政策进行适当的规划,以便进行正确的补救。

与上述发现一致,大多数企业倾向于围绕网络安全基础设施,如防火墙或入侵检测和保护解决方案,开始AIOps的部署和整合,以更好地检测异常情况,升级警报和补救安全问题。也就是说,包括数据中心交换、云网络和应用交付网络解决方案在内的应用基础设施是一个强有力的二级优先事项。AIOps解决方案部署的最后一个重点领域是Wi-Fi和WAN基础设施。

AIOps是关于数据的

鉴于这些AIOPs的优先级,以及与任何AI/ML相关的事实,AIOps都是关于数据的,企业发现数据管理(48%)是网络团队需要的首要技能,这并不奇怪。事实上,早期的研究发现,数据质量差是成功应用AIOps进行网络和安全管理的主要技术挑战。除了数据背景之外,企业将一般的人工智能和基础设施知识(42%)作为第二优先技能。

这表明,一些企业可能正在开发内部AIOps能力,或希望修改商业解决方案。同样,算法开发和API技能(39%)在优先级列表中都很高,再次表明企业正在构建或微调底层算法,并努力将软件和工具更广泛地整合到AIOps领域。

总体观点是,希望在AIOps方面取得成功的企业正在寻求用特定的数据、AI、算法和整合技能来补充他们的网络或安全团队。

企业希望有效地回答复杂的问题,以加快解决。AIOps允许企业采用AI/ML来补充IT团队的能力,以快速识别和缓解对整体网络性能或安全的威胁,包括异常检测、自动安全和事件修复等问题。

随着新工具的出现,NetOps团队需要学习新的技能,如数据管理、AI知识和算法开发。最终,这可以帮助这些团队和公司简化工作流程,更好地解释数据,并有效和安全地管理网络。