2024年智能算法的统一运维监控管理平台报告
今天分享的是:2024年智能算法的统一运维监控管理平台报告
报告共计:26页
湖北省农村信用社联合社陈胜在2024全国农村金融科技创新与共享发展会议上介绍了基于智能算法的统一运维监控管理平台,助力湖北农信高效、智能、全面运维管理。
1. 项目背景与目标
- 背景:银行核心业务系统复杂多样,运维数据量剧增,监管要求高,且面临运维效率与成本平衡难题,同时存在日志分散、监控工具滞后等问题。
- 目标:以数据、算法、场景为导向,实现故障预防、发现、定位、恢复及复盘改进,达成运维闭环管理,包括资源全面监控、统一日志管理、全面应用调用链分析、集中告警管理、智能数据分析和快速故障定位等。
2. 平台架构与创新特点
- 架构:包含智能运维一体化平台、运维中台(含运维数据平台、CMDB、算法中心、低代码平台等),采集多种运维数据,覆盖多种应用和基础设施。
- 创新点
展开剩余85%- 统一门户与权限管理:整合功能,实现跨系统可视化,依角色分配权限。
- 基础资源监控全覆盖:监控云上云下资源,支持阈值设置和拓扑展示。
- 日志集中管理:接入全量日志,采用特定技术架构实现智能化管理。
- 业务系统链路全覆盖:构建性能监控体系,实时监控告警。
- 立体化监控管理:集成多种监控工具,多维度分析。
- 统一配置管理:管理云上云下资产,提供数据支撑。
- 生产事件闭环管理:统一告警接入,实现事件工单闭环。
- 核心业务数据可视化展示:建设大屏展示核心业务数据,辅助决策。
3. 智能运维场景
- 算法中台:提供多种算法及泛型,支撑运维场景,缩短问题发现和故障排查时长。
- 数据中台:采集、处理、存储运维数据,实现全链路追踪、分析和告警。
- 全链路可观测及故障定位:构建拓扑,联动多维数据辅助定位故障。
- 基于日志算法的故障发现:自动发现日志模式异常。
- 告警降噪与单指标异常检测:AI降噪,提高告警准确性。
4. 项目成效
- 项目价值:提升运营效率、降低风险、支持决策,推动业务创新。
- 总体收益:运维层面实现资源统一管理,提前预测故障,提高定位和解决问题效率,降低误报率;管理层面减少人工干预,提升运维和决策效率,增强用户满意度。
以下为报告节选内容
发布于:广东省