同创金融生态共建美好未来,建行云助力2021国际AIOps挑战赛
发布时间:2021-03-01 19:58:00
各位嘉宾、各位选手、各位关注智能运维的同仁们,大家下午好!
我是中国建设银行运营数据中心王升东,我今天分享的主题是《同创金融生态,共建美好未来——建行云助力2021国际AIOps挑战赛》,围绕初识建行云、建行云服务、建行云生态运维理念和体系、建行云资源助力AIOps挑战赛等四部分展开。
01/初识建行云
建行云(yun.ccb.com)是中国建设银行(以下简称“建行”)利用云计算技术建设并自主运营的云环境,是支撑建行战略发展的重要基础平台。
建行云自建设以来,不仅实现了服务建行集团自主业务的核心目标,同时面向政府机构、企业客户以及社会大众等不同类型服务对象,提供多元化的金融科技生态服务。下图是建行云官网界面,为2021国际AIOps挑战赛提供了报名入口。
回顾建行云的发展历程,可以说引领了金融行业云计算技术发展的潮流。早在2013年开始新一代架构设计时,建行把企业级基础设施架构设计提高到和应用架构设计的同等高度,突破了原来烟囱式的IT建设方法。当时,国外以亚马逊、微软为代表,国内以阿里为代表的互联网云服务商起步不久,相关的技术栈相较商业虚拟化技术栈而言尚不成熟。建行率先引入商业虚拟化软件技术栈,构建了当时金融界最大的云平台,并在2016年顺利支持建行新一代核心系统的投产。
2018年,为适应互联网时代发展要求和有效支撑建行“普惠金融、住房租赁、金融科技”三大战略,建行敢为行业先,以自主掌控核心技术为基本要求,引入业界成熟的互联网技术栈,逐步解决商业技术栈在自主可控、生态化服务、开放共享等方面存在的适应性不足问题,满足了生态业务和外部客户托管业务的部署需求。
随着2020年北京稻香湖数据中心的投产,建行云完成了“两地三中心”的布局,具备同等系统部署的能力,满足了多地域部署的需求。
我们打造的多功能、强安全、高质量的建行云,是贯彻落实建行金融科技战略的生动实践。这里介绍一下我行的“Top+”金融科技战略:一、以技术与数据构成科技双要素,双轮驱动金融创新,其核心技术之一就是云计算;二、在符合监管要求的前提下,我行的集团业务功能和数据以服务的方式向社会开放,充分激发外部的活力和创造力,打造建设银行的应用商店,建行云就是这些应用商店所在的操作系统;三、打造平台生态,共同构建用户生态圈,在履行国有大行社会责任的同时,满足人民日益增长的生活需要,建行云就是平台生态的土壤。
建行云的定位是什么?总结来说,建行云是建行战略发展的基础支撑平台,以服务智慧金融和智慧生态内外发力的业务体系为核心目标,与用户、合作伙伴同创金融生态,共享美好未来。此次建行助力2021国际AIOps挑战赛,正是希望与IT运营圈的同仁们同创生态,共同打造运维人的美好明天。
建行云发展到今天,已经具备典型的差异化优势,表现为:
- 其一,金融级安全服务。建行云的安全体系依托于建行企业级的新一代安全架构,为客户提供智能化、一站式、开放共享、随需所用的云安全服务,为客户的信息安全提供充分保障;
- 其二,金融级解决方案。建行拥有多年的金融行业能力以及金融应用系统建设的经验,可以为集团和外部客户提供专业、领先的解决方案;
- 其三,多样化行业应用。我行基于金融科技能力,服务民生、解决社会痛点,构建社会化数据平台,将技术服务推向社会,为各行各业赋能;
- 其四,生态化运维服务。我们有“国际一流、国际领先”的金融专家级运维人才,提供金融级的生产运维服务能力,构建建行云的运维生态。
02/建行云服务
接下来介绍建行云提供的服务,带领大家进一步深入了解建行云。
建行云提供从IaaS到SaaS的全领域云产品,在IaaS方面,基础设施产品位于业界第一梯队,主流IaaS产品能力基本全覆盖,计算、存储、网络等产品一应俱全;在PaaS方面,提供数据库、中间件、大数据、区块链、人工智能等平台服务,持续提升平台的服务水平;在SaaS方面,在云上部署开放银行、住房租赁、智慧政务、党群服务和善行宗教等一系列智慧金融及智慧生态的SaaS服务,极具建行特色,在行业的服务范围和服务能力方面具有明显的领先优势。
除全领域云产品外,建行云的首要特征是金融级安全服务优于其他云平台,延续了建行新一代安全架构体系,按照多重水闸式的防护理念,将建行安全体系优势和业界互联网安全防护体系双重叠加,推出龙系安全产品,构建边界防护和纵深防御并重、集中+分布式协同的建行云安全架构。建行云真正做到了“进不来、攻不破、拿不走、读不懂、赖不掉”,为客户提供智能化、一站式、开放共享、随需所用的云安全服务。
建行云的安全性已通过公安部等保2.0测评,整体达到等保三级,关键业务等保四级。特别是在公安部组织的护网行动中,建行云作为防守方,监测发现攻击120万余次,自动阻断危险攻击3.9万次,在全行的努力下防守未失一分。
建行云凭借高质量的管理和服务获得了广泛的认可,通过了ISO20000信息技术服务管理体系认证、ISO27001信息安全管理体系认证、可信金融云服务认证以及等保2.0测评,还获得了企业数字基础设施云化管理和服务运营能力IOMM成熟度评估。这些都是对建行云服务能力和服务水平最好的证明。
03/建行云生态化运维理念和体系
下面重点介绍一下建行云生态化运维理念和体系。
建行云不仅依靠专业的运维能力来确保云的安全稳定运行,而且致力于打造生态化运维,提升行业的运维水平。我们提出了Eco-Ops理念,即“开放共享、众创共建”,将运维业务从单打独斗变成共同奋斗,从建设升级走向生态演进。建行云生态化运维具备整体性、开放性、生态运营、多元化和服务化5大特点,涵盖了生态化运维模型、运维方法论研究和运维工具体系设计三驾马车。
生态圈成员可以利用生态环境的各种能力,快速构建自身的运维服务能力,开发形成独特的运维服务,并可通过生态圈运营管理活动将自身服务发布,通过自身和生态圈的打通,运维共识不断形成,行业实践不断涌现,运维成果快速分享,实现生态圈的持续自我进化和发展。
建行云生态化运维体系不是无本之水,整体基于“龙舟”运维平台构建。“龙舟”运维平台是建行依托多年的金融企业级的安全运维体系和经验,吸收互联网行业服务化、敏捷化的运维理念而打造。
“做平台,搭场景。”“龙舟”运维平台全面支持多租户、多云管理和异构环境,屏蔽底层的差异,形成建行标准的CCBAPI。租户可以共享运维平台能力,依托平台做二次开发,做自己的特色场景和客户的定制需求,实现众创、共建、共享。
“龙舟”运维平台不仅提供丰富的运维功能,快速满足云上的运维场景;而且通过不断积累运营能力和运营数据,为智能化运维提供支撑,特别是利用平台能力解决运维人员日常工作中的痛点,实现向运维开发的转型,将原来人工操作的工作交由机器处理,实现专业化运维工具,进而走向生态化运维。
伴随着整个平台的发展,参与人员的增多,我们可以利用丰富场景产生的运维数据,不断探索、提升智能化的运营水平。
数据是智能化运维的基础,监控是数据最重要的来源之一。运维人员使用“龙舟”运维平台可以实现多维度监控云环境和云应用,包括操作系统、数据库、中间件、日志监控、服务拨测、应用监控等。同时监控平台支持本地采集和远程采集模式,通过统一的计算和存储平台来处理监控数据,实现监控数据的可视化展示和事件的触发。2021国际AIOps挑战赛中,建行提供的性能指标数据和监控数据正是“龙舟”运维平台采集的,可以说这些数据让AIOps成为可能。
一个生态化的运营场景应该是什么样的呢?基于“龙舟”运维平台的强大支撑,运维工具花繁叶茂,各种各样的专业化运维工具得以实现;整个生态围绕云、行业和产品的理念,生态圈成员众创共享。从建行云自身运维来说,有专业化的运营团队,把金融级运营流程、运维应用做成工具发布到平台上,它既可以是一个应用,也可以是一个通用流程;第三方合作伙伴可以将专业化能力集成到平台上,使平台的能力变得更加强大;外部客户可以共享生态中的运维工具,也可以成为创造者,贡献自己的力量。
04/建行云资源助力AIOps挑战赛
建行云将为2021国际AIOps挑战赛提供哪些支持和服务?
首先,建行云为挑战赛提供报名入口,参赛选手访问建行云官网(yun.ccb.com)可进行报名;其次,建行云提供此次比赛所需要的算力资源,在预赛阶段我们一共提供202台8C32G挂载着600G高性能SSD硬盘的云主机(注:结合参赛报名情况,增加50台机器,共计提供252台云主机),在复赛阶段,建行云提供的算力会同步加码,云主机的CPU配置将加倍。
各位选手通过以下4步可获取高性能的云资源:
- 通过扫码或者访问建行云官网报名;
- 挑战赛组委会对报名信息进行审核;
- 审核通过后,组委会通过邮件下发建行云主机使用说明;
- 各位选手根据说明完成登录验证后,即拥有自己的参数算力资源。
这里简单介绍一下登录方式和注意事项,详细说明请参照组委会的邮件。各位选手访问组委会提供的堡垒机登录域名,输入用户名(全拼),输入静态密码和手机号获得的动态验证码,即可轻松登陆。首次登录后页面会提示更新静态密码,请及时更新为自己的专属密码,更新后的静态密码将用于后续登录,请大家牢记。
同时,建行云秉持安全理念,为本届AIOps挑战赛提供全方位的金融安全服务,请各位参赛选手安全使用云资源,关注以下注意事项:
- 严禁将比赛数据用于非比赛、非科研的用途;
- 严禁使用云主机进行网络攻击,比如DDoS攻击、流量分析、窃听等网络攻击行为;
- 严禁使用云主机从事挖矿、资源中转站等其他与比赛无关的活动。
建行云会实时开启对云主机的舆情监控、安全防护和行为审计,一旦发现并核实参赛队伍具有违规行为,组委会有权取消比赛团队的资格,情节严重者将被追究法律责任。请大家务必关注本次云资源使用的安全性。
最后,我以建行云官网发布的牛年新春海报,预祝参赛选手取得好成绩,也希望2021年我们同舟共济千帆起,牛转乾坤时序新,谢谢大家!
【精彩Q&A】
2021国际AIOps挑战赛启动会直播活动中,中国建设银行在智能运维领域的探索和实践,激发了线上观众的讨论和思考。根据线上提问的内容整理如下:
建行在智能运维实践中遇到过哪些挑战?采取了哪些应对措施?
各行各业在智能运维方面都会遇到挑战,从建行自身实践来看,主要面临数据治理、数据分析能力提升以及智能运维实际落地等三方面的挑战。
对此,建行采取了以下措施:首先,在数据治理方面,我们的经验是建立规范体系。早在建行新一代架构体系建设的时候,我们从运维的角度提出 “所有的应用监控要有一套规范体系”。每个系统监控的数据应该符合什么规范?从交易码到整个交易流向都提前规范化,在开发时按照规范操作,最终产生规范化的数据。有了规范数据,后续的分析处理比较容易实现,避免重新治理数据。
其次,在数据分析能力提升方面,我们提出“生态化运维”理念,核心是集合大家的力量,共享工具或者服务,来持续提升数据分析能力。
最后,在智能运维实际落地方面,我们的经验是针对具体场景去落地智能化。当前运维过程中面临的最痛点的问题是什么?是对交易量突发的预测还是某些故障发现时自动化处理问题?先把要解决的问题识别处理出来,再做具体问题场景进行智能化处理。
建行云生态化运维已经形成了体系化,从运维规范模型到方法论、运维工具构建,最终把数据治理分析能力的提升和应用衔接在一起,一步一步地实现智能化目标。