《研发运营一体化(DevOps)能力成熟度模型第4部分:技术运营dr.docx》由会员分享,可在线阅读,更多相关《研发运营一体化(DevOps)能力成熟度模型第4部分:技术运营dr.docx(26页珍藏版)》请在优知文库上搜索。
1、ICS35.0201.70YD中华人民共和国通信行业标准YD/T3763.42020研发运营一体化(DevOps)能力成熟度模型第4部分:技术运营Thecapabilitymaturitymodelofdevops-Part4:technicaloperationmanagement(报批稿)(本稿完成期:2019.11.12)-X发布XXXX-XX-XX实施中华人民共和国工业和信息化部发布目次前言Il1范围12术语、定义和缩略语12.1 术语和定义12.2 缩略语13技术运营管理过程概述14监控管理24.1 监控采集24.2 数据管理34.3 数据应用55事件与变更管理65.1 事件管理65
2、.2 变更管理86配置管理96.1 运营配置管理97容量和成本管理117.1 容量管理117.2 成本管理128高可用管理138.1 应用高可用管理138.2 数据高可用管理169业务连续性管理179.1 风险管理179.2 危机管理189.3 应急管理1910用户体验管理20I(U业务认知管理2110.2 体验管理21本标准是“研发运营一体化(DevOps)能力成熟度模型”系列标准的第4部分:技术运营,该系列标准的结构和名称如下:第1部分:总体架构第2部分:敏捷开发管理第3部分:持续交付第4部分:技术运营第5部分:应用设计第6部分:安全及风险管理第7部分:评估方法第8部分:系统和工具技术要求
3、本部分按照GB/T1.12009给出的规则起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本部分由中国通信标准化协会提出并归口。本部分起草单位:中国信息通信研究院、深圳市腾讯计算机系统有限公司、北京华佑科技有限公司、平安科技(深圳)有限公司、中国太平洋保险集团、中国电信集团有限公司、中兴通讯股份有限公司、中国移动通信集团有限公司。本部分主要起草人:梁定安、徐奇琛、王超、栗蔚、刘栖铜、萧田国、牛晓玲、车昕、党受辉、杨军、杨文兵、朱平、范晶晶、吴树生、陈亚殊、胡罡、杜颖君、陈靖翔、张南、曾庆辉、闫林、吴新颖、刘扬清、任明、毛茂德、燕杰、雍浩淼、潘晓明。研发运营一
4、体化(DevOps)能力成熟度模型第4部分:技术运营1范围本部分规定了研发运营一体化(DevOps)能力成熟度模型下技术运营管理的能力成熟度要求和评价方法。本部分适用于具备IT软件研发交付运营能力的组织实施IT软件开发和服务过程的能力进行评价和指导;可供其他相关行业或组织进行参考;也可作为第三方权威评估机构衡量软件开发交付成熟的标准依据。2术语、定义和缩略语2.1 术语和定义下列术语和定义适用于本标准。研发运营一体化DevOps它是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保隙(QA)部门之间的沟通、协作与整合。注:它的出现是由于软件行业认识到为了按时交付软
5、件产品和服务,开发和运营工作必须紧密合作。2.2 缩略语下列缩略语适用于本文件。API应用程序编程接口CD持续交付CDN内容分发网络CI持续集成CPU中央处理器ETL数据仓库技术IT互联网技术RPO恢复点目标SDK软件开发工具包SQL结构化查询语言TCC两阶段补偿型分布式事务ApplicationProgrammingInterfaceContinuousDeliveryContentDeliveryNetworkContinuousIntegrationCentralProcessingUnitExtractTransformLoadInternetTechnologyRecoveryPoi
6、ntObjectiveSoftwareDevelopmentKitStructuredQueryLanguageTryConfirmCancel3技术运营管理过程概述技术运营管理过程是技术运营能力建设的一个过程,它以业务为中心,交付稳定、安全、高效的技术运营服务,构建业界领先的技术运营能力,支撑企业的持续发展和战略成功。技术运营不仅关注“稳定”、“安全”、“可靠”,更要关注“体验”、“效率”、“效益”。技术运营管理过程分为:监控管理、事件与变更管理、配置管理、容量与成本管理、高可用管理、业务连续性管理、用户体验管理等,如表1所示。表1技术运营管理过程监控管理事件与变更管理配置管理容量与成本管理
7、高可用管理业务连续性管理用户体验管理监控采集事件管理运营配置管理容量管理应用高可用管理风险管理业务认知管理数据管理变更管理成本管理数据高可用管理危机管理体验管理数据应用应急管理4监控管理监控管理是对研发运营过程中的对象进行状态数据采集、数据处理分析和存储、异常识别和通知及对象状态可视化呈现的过程,其成熟度决定了技术运营工作的立体性、及时性和有效性。监控管理从数据流的维度展开分析,包括3个部分:监控采集、数据管理和数据应用。4.1 监控采集通过主动采集或被动收集方式获取监控数据,并保证采集数据的质量、采集过程的可靠性和安全性。监控采集的能力指标包括数据采集和数据传输,如表2所示。1 .1.1数据
8、采集将数据采集能力服务化,从采集的手段、支持的协议、兼容性、颗粒度、采集端的基础逻辑和扩展逻辑等角度对采集能力进行量化评估。4 .1.2数据传输采集能力的数据传输指从传输数据的质量保障、传输的可用性、传输过程中支持的功能特性的纬度来评估其能力成熟度。如表2所示表2监控采集级别数据采集数据传输1具备操作系统级监控指标的采集能力,如CPU、内存等。通过标准协议传输数据。2在1级基础上,需达到以下要求:1) 具备独立的数据采集服务,可采集多种数据类型的日志,如:系统日志、应用日志、接口日志等;相关采集方式包括但不限于嵌入SDK、API、私有协议等;2) 量化管理采集服务的覆盖范围,如能反映企业应用的
9、覆盖率;3) 数据采集可上报到多个服务端;4) 数据采集服务支持可扩展、可配置和高可用的采集架构。在1级基础上,且需达到以下要求:1) 具备独立的数据传输服务,可传输不同数据格式,如int、charsbinary等格式;2) 支持单份数据多份订阅及分发传输。3在2级基础上,需达到以下要求:1) 统一的数据采集服务,可跨平台兼容;2) 提供开放式、自定义的数据内容采集上报方案;3) 具备集中式的采集配置,包括但不限于采集内容、开关等:4) 对采集端进行实时管控,如采集管控、发送延迟、数据校验、统计等方式,并可通过插件化扩展采集逻辑;5)自定义监控内容,具备对采集服务的管理方法,如:采集限制、采集
10、限频等。在2级基础上,且需达到以下要求:1) 具备高可靠数据传输通道和高可用容灾方案:2) 支、多种传输方案,如同时具备数据推与拉的能力;3) 支持数据采集架构的平行扩展、数据汇聚和高效传输等能力。4在3级基础上,且需达到以下要求:1)采集频率可自定义配置调节:2)部分数据采集通过智能化技术动态调整,如智能减少采集内容、智能降低采集频率等。在3级基础上,且需达到以下要求:1)具备数据传输质量和安全的保障机制,如支持数据分片、压缩、断点续传等传输特性;2)保障数据传输的安全性,如数据加密、解密及校验等。5在4级基础上,且需达到以下要求:1)采集服务与技术运营活动关联,实现从固化到动态化的采集规则
11、,如压力测试活动时,将采集频率动态调整为秒级;2)实现监控能力的精细化,智能配置关联运维事件,实现同一运维对象的不同采集内容变化。同4级能力要求。4.2 数据管理数据管理是指对数据进行过滤、转换、提取、聚合和存储等操作,是数据监控的核心能力。按数据管理过程的三个环节,来量化具体的能力模型,包括数据接收、数据处理和数据存储,如表3所示。注1:本章介绍的数据多指与运营相关的数据(非敏感业务数据),由多个纬度组织而成,可看作大数据处理平台的能力。4.3 2.1数据接收作为数据处理服务端的数据接收服务,承接数据采集服务传输来的数据,需要拥有良好的吞吐性能和可扩展的架构,并且具备区分数据类型和相应处理的
12、功能逻辑。4.4 .2数据处理数据处理指大数据处理的逻辑,支持逻辑运算、统计方法、机器学习等计算能力,可结合技术运营的场景,灵活实现数据的扩展与关联分析。同时,需考察数据处理的规模、性能及架构的能力。4.5 .3数据存储数据存储只针对监控数据的存储场景,对存储的方案、架构、存储成本、数据高可用等纬度综合评估。如表3所示表3数据管理级别数据接收数据处理数据存储1正常接收数据,可对接收到的数据进行量化管理和反查。1、对原始数据源进行预处理:2、对异常数据进行监控识别与校对。提供独立的数据存储。2在1级基础上,且需达到如下要求:1) 数据接收架构可根据容量扩容,可平行扩展:2) 可对基础数据进行初级
13、筛选,如数据转发、数据复制等;3) 可对原始数据进行规则化处理,如数据清洗、校对等:4) 可集中接收异构数据源的上报。在1级基础上,且需达到如下要求:1) 具备常用的数据处理逻辑,如自定义数据四则运算、统计(分类、聚类)等;2) 对外提供数据接口服务:3) 支持可扩展的ETL,实现如数据清洗、转换、导入和加载等功能:4) 对异构数据源进行常用数据处理逻辑分析和关联分析。在1级基础上,且需达到如下要求:1)提供统一的数据存储:2)数据存储架构可扩展,支持根据数据类型、容量等扩展方式;3)数据存储架构支持数据高可用管理,可保证数据的一致性、完整性和可用性等特性:4)可言储多种数据结构和数据类型,如
14、时序数据、文本、数值型和位图等。3在2级基础上,且需达到如下要求:1) 提供统一的数据上报服务,支持多协议多格式的数据源,如文本、字符串和加密协议等;2) 对数据进行进一步的校验,如空值检测、乱码校验和属性校验等;3) 对接收到的数据进行过我保护。在2级基础上,且需达到如下要求:1)数据处理架构可平行扩展、扩容;2) 对数据进行实时计算与离线计算,实时计算的数据处理延时小,如小于1分钟;3) 可处理结构化与半结构化数据,如时序数据、自定义日志数据等;4) 保证数据处理过程中的完整性,如数据校正、数据持久化等;5) 对数据处理过程中的异常状态进行监控和缶警,并具备相应的应对能力,如识别作业异常、数据比对异常等。在2级基础上,且需达到如下要求:D提供高频高密度查询的吞吐能力,如通过SSD或缓存技术实现高并发查询:2)按数据使用场景的冷热数据分离存储;3)存储和快速检索结构化与半结构化的数据;4)可统计时序数据:5)具备数据安全管理能力,如数据容灾,备份、仓库容量高可用设计等。4在3级基础上,且需达到如下要求:1) 全网数据秒级上报:2) 可根据数据上报量,动态管理数据接收容量与吞吐性能。在3级基础上,且需达到如下要求:1) 数据处理逻辑支持可配置、可视化和可编排:2) 数据处理逻辑可通过插件化扩展;3)提供灵活的数据建模能力,可关联不同数据源,按业务场景