云智慧AIOps智能运维应用实战之统一告警

  • 时间:
  • 浏览:0
  • 来源:极速1分彩下注平台_极速1分彩注册平台_极速1分彩官网平台

    企业IT系统构建是一有一个 聚沙成塔的过程,伴随业务规模的不断增长,IT系统太满、IT架构的繁复度呈指数级增长,运维部门承受着巨大的管理压力,这就时要对离散的IT监测系统和海量的告警数据进行统一的采集、外理和呈现。

    云健康智慧基于大数据和机器学习算法构建的智能运维统一告警平台,有益于接入各种主流监控系统的告警消息与数据,实现统一的告警接入、发送与外理,帮助用户打通数据孤岛,建立统一标准与管理规范,减少对运维的事务性干扰,提升运维和企业运营的整体管理水平。

    智能化统一告警管理典型应用场景和需求分析

    智能运维统一告警平台广泛适用于核心业务对IT的依赖程度较高,具有较大IT规模和较高IT成熟的句子的句子是什么是什么是什么期是什么度的中大型企业,非常重视IT速率 对业务效能的提升,希望充分利用云计算、大数据、人工智能技术,从而获得互联网+和数字化转型的成功,然而在现实中常常具备以下场景底部形态:

    业务系统繁多:包括企业HR系统、OA系统、财务系统、订单系统、ERP系统、协同系统、进销存系统等多个业务系统;

     IT系统规模繁复:IT系统的繁复性原困分析对应的监控系统繁多,监控系统分散但关联性很强,技术体系不统一,有些已非常陈旧;

     运维压力巨大:运维人员少,在多个监控系统间往返,工作速率 低,不断受到业务部门的投诉和抱怨,绩效考核难,流动性大,新人培养困难;

    智能运维统一告警应用场景和管理需求如下:

    监控系统离散,各个监控系统的告警规则设置法律土办法不同,告警消息分散存储,不便于统一管理;

    告警通知法律土办法有限,基本采用邮件和短信告警,一个 劲会造成“告警风暴”,各个业务系统的告警法律土办法不同,无法自定义告警消息格式;

    告警后定位疑问困难,时有益于够快速知晓并定位疑问,针对告警消息关联定位到历史快照;

     缺少外理具体告警疑问外理的自动化运维手段,针对 “模式化”疑问,时要通过告警事件形成标准的自动化外理手段(如服务自动重启)等;

    欠缺统一的告警分析及外理平台,缺少集中的告警事件消息的展现及外理界面,分散管理造成人工及管理成本的增加;

    尚未建立健全面向标准规范的告警事件外理机制与流程,无法与企业的ITIL等事件管理流程及系统进行对接,无法形成面向疑问事件分级外理的管理模型及支持面向运维人员的可量化KPI考核体系。

    智能化统一告警管理外理方案

    云健康智慧智能运维统一告警平台可通过restAPI 、Agent 等采集法律土办法实现多套监控系统数据的统一接入告警平台,形成统一派单、统一运维的效果,建立更加完正的监控体系,帮助企业用户达成5个“统一”:统一管理、统一规范、统一外理、统一展现、统一通道、统一权限。

    整合主流的开源监控工具及商用监控产品,将以上各种监控软件采集的性能指标参数通过该平台进行统一的告警规则及发送、排班设定,同时也支持直接接入并发送哪此监控系统产生的告警消息;

     支持手机短信、电子邮件、电搞笑的话音、企业微信、App推送等多种告警通知法律土办法;

     告警平台能帮助用户在一有一个 统一平台上可视化查看及管理IT系统的所有告警消息,基于可配置的疑问事件等级管理及与内控 系统的集成接口,帮助企业用户形成标准的告警事件外理流程和考评体系。

统一告警平台围绕接入发现、设置部署、异常告警、关闭总结的闭环管理流程进行设计,帮助企业构建含有“监控、工单、自动化运维”等完正的运维支撑体系,达到设备接入可发现、无盲点,监控手段同步跟进,异常情況及时预警,故障告警完正跟踪,故障外理外理方案可归档的互联网级运维响应目标。

    智能化统一告警管理典型案例

    某金融公司拥有 30 余套核心业务监控系统,但会 每个系统会独立的产生告警通知,当出现大规模故障时,运维人员同后会 收到来自各个系统的少量告警通知,对正常的工作造成了极大困扰。

    通过部署云健康智慧智能告警平台,利用 restAPI 、Agent 采集等法律土办法对接各个监控系统,将各个系统的告警消息进行统一汇聚和整合,让运维人员在一有一个 平台上接收、外理所有故障消息,配合前文提到的告警抑制和智能关联分析功能,大幅缩短了整个运维团队的平均接手时间(MTTA,Mean Time To Assistant缩写),从过去的平均 25 分 23 秒降低到了 4 分 16 秒。

    自 2016 年云健康智慧推出智能运维统一告警平台以来,可能在银行、证券、保险、航空、医药、制造、新零售等数5个行业的上百家中大型客户中得到了成功部署和良好运行。在 2018 年 7 月Gartner发表的《Hype Cycle for ICT in China, 2018》中,云健康智慧籍此平台成为AIOps领域的Sample Vendors。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户亲戚亲戚朋友,发现稿件发生不实报道,欢迎读者反馈、纠正、举报疑问(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及可能发生的风险,任何后果均由读者自行承担。

有好的文章希望站长之家帮助分享推广,猛戳这里我想投稿