面对复杂的现代云环境,基于机器学习的方法必须让位于真正的AIOps系统和实践。量子计算将加速这一转变,帮助企业实现更高效、简化的流程。
如今,随着组织加速数字化进程,越来越多的企业转向由人工智能(AI)驱动的软件智能,以实现更大的智能自动化和垂直整合。在迁移到多云架构并采用微服务、容器和其他云原生技术的过程中,企业必须提高效率并简化流程。在管理复杂的现代云环境时,基于机器学习的方法必须让位于真正的AIOps系统和实践。
基本的机器学习工具对人类的需求过高。考虑到商业环境:一个故障可能会影响到无数个相互连接的服务。此外,区分正常和故障应用程序行为也具有挑战性。目前,传统的监控工具依赖机器学习——一种统计解决方案——来发现问题的根源。为了识别故障,基于机器学习的AI将事件、应用程序性能指标和警报进行关联。
然而,这些解决方案需要接受培训。由于单一故障可能会触发警报风暴,所以警报并不那么有用。此外,机器学习工具在识别未知数和问题的根本原因方面往往失败。同样重要的是,大多数传统方法在解决问题方面发挥了较小的作用。
因此,理解警报并追溯到根本原因——通常是艰苦且耗时的工作——主要依赖于人类。
相比之下,确定性AI实时搜寻堆栈中的每个缝隙以获取每个相关数据,从而构建精确的故障树分析。确定性AI生成一个拓扑关系地图,使得可以直观地看到受影响的组件以及了解所有内容如何联系在一起。因为AI拥有堆栈中每个组件的所有数据,并知道不同实体之间的关系,所以它可以快速准确地识别根本原因。
这时,最好的AIOps平台可以在大多数用户意识到故障之前启动自动修复程序。
归根结底,机器学习与AIOps的区别在于:由初级机器学习驱动的软件只能对故障和性能问题的原因做出有根据的猜测,同时依赖人类做出决策。而确定性AI工具在另一方面,可以更快速、准确地识别问题的根本原因,并在很大程度上降低对人类的依赖。