某城商行智能运维项目(一)
发布时间:2020-07-01 10:31:32
客户情况介绍
该银行成立于1996年,是一家具有独立法人资格的股份制商业银行,2007年成功上市,资产规模约1.62万亿元,下辖17家分行,201家营业网点,实现布局京沪杭及江苏省内区市全覆盖。作为中国区域银行里的排头兵,强劲的IT能力和业务能力使其在科技金融的发展领域不断绽放光彩,科技金融是该行高度重视的发展方向。
业务挑战
交易性能监控覆盖不全
行内已建设BPC业务性能监控,但实际上监控覆盖的指标只有600余条。
交易性能监控不能发现隐患
监控分析能力有限,当指标恶化到一定程度才会发出告警。
海量交易明细人工排查难
每笔交易有M个维度,每个维度有N个值。异常交易的共性存在于N 种可能性中。
交易告警风暴根因难找
交易调用关系复杂,容易引起连锁反应。需在多个交易告警时尽快定位根因交易,缩短排障时间。
解决方案概述
本项目通过业务指标异常检测模块自动识别交易指标个性,解决海量规则识别问题,最终以较小成本扩大交易性能监控覆盖范围。第二,利用业务指标异常检测模块自动识别指标的历史规律,发现异常程度低,但长期偏离历史正常规律的异常形态,提示用户及时纠偏。第三,针对海量交易明细数据需人工排查的问题,通过构建业务指标多维定位自动排查海量交易明细,从N 根因空间中,快速识别大数的维度组合。最后,使用调用链根源系统定位算法,充分利用节点间调用链数据,剖析问题根源。
客户收益
该项目在融合“多场景+多算法+多数据源”的基础上,通过大数据和人工智能技术赋能IT运维领域,从数据中获得洞察力,攫取价值。
提升监控覆盖范围:
- 系统覆盖从传统监控的100+到目前的240+
- 从人工配置告警规则下的600条监控到现在的目前自动纳入监控点5500+
- 从传统监控的6个维度手工分析到目前自动触发18个维度的多维分析
异常发现能力、故障快速定位能力,得到明显提升:
2021年3月项目上线至6月份,排除数据质量引起的异常,实际生产中共发现隐患57个;
交易码调用链根因系统定位准确度达到75%;业务指标多维定位准确度超过90;
业务指标异常检测准确率在95%以上。