《GB_T 43782-2024 人工智能 机器学习系统技术要求.docx》由会员分享,可在线阅读,更多相关《GB_T 43782-2024 人工智能 机器学习系统技术要求.docx(14页珍藏版)》请在优知文库上搜索。
1、ICS35.240CeS1.70三中华人民共和国国家标准GB/T437822024人工智能机器学习系统技术要求ArtificialintelligenceTechnicalrequirementsformachinelearningsystem2024-03-15实施2024-03T5发布国家市场监督管理总局国家标准化管理委员会发布目次前言2规范性引用文件3 术谱和定义4 缩略谐5 系统楸架25.1 概述25.2 机器学习运行时组件35.3 机器学习框架35.4 机器学习服务组件35.5 工具5.6 运维管理6功能要求6.1 机器学习运行时组件6.2 机器学习框架46.3 机器学习服务撤件56
2、.4 工具66.5 运维管理77可标性要求88维护性要求89兼容性要求89.1 软件慈容性要求89.2 硬件兼容性要求8IO安全性要求9Il可扩展性要求参考文献本文件按照GBT1.12020标潴化工作导则第1部分I标准化文件的结构和起草规则的规定起草.请注意本文件的某些内容可能涉及专利.本文的发布机构不承担识别专利的贡任.本文件由全国信纪技术标准化技术委员会(SACZrC28)提出并归I.本文件起草单位:中国电子技术标准化研究院、华为技术有限公司、北京百度网讯科技有限公司、上海商汤智能科技行附公司、膜讯云计尊(北京)有限责任公司、网易(杭州)网络有限公司、浪潮电子信息产业股份右限公司、北京眼神
3、科技仃限公司、中国【:程物理研究联计算机应用研究所沈阳东秋智能医疗科技研究院有IS公司、北京软件产品质量检测检脸中心、山东看计算中心(国靠超级计算济南中心人上海燧原科技有限公司、美的集团(上海)有限公司、海信集团控股股份有限公司、上海计故机软件技术开发中心、清华大学、北京航天自动控制研究所、中国科学院软件研究所、上海人工智健研究院有限公司、郑州中业科技股份有限公司.北京智芯微电子科技有限公司、武汉精测电子集团股份有限公司、长或佰息科技发展股价外限公司,江汉大学,飞夥信息技术(北京)付限公司、中国医学科学院生物医学工科研究所,北京林业大学、中国电子科技集团公司第二十八研究所、常州微亿科域科技仲限
4、公司、兴容(上海信息技术股份有限公司.本文件主要起草人:水建、王匏尔、马骋是、仲阳奇、斯伟、蜘双符海芳、诚、谢永康、郑少秋、于埼、张军、蒋慈、刘海涛,煲岬碎,杨春林、吴庚、王RB媛、程万军、孔吴、漆连芝、高永超、周昱瑶,王思善、车正平、徐洋、高雪松、陈岐刚、李川于、群云志、孟令中、宋海涛、B马珊珊、李精娥、王资凯、李介、裳福生、张胜萩、蚁文艳、谷潇聪、潴江波、吴铉祥、赵雅借、李仁刚、朱宝峰、马泽宇、光明、李亚坤、廖班志、1三W.徐颂、黄超、高卉、马元S三,夏寅力、卢国鸣一蒋第、梁汝照.人工锂能机器学习系统技术要求1Mfl本文件提出了机器学习系统框架,规定了功能、可雅性、维护性、兼容性、安全性和
5、可扩展性要求.本文件适用于各领域机器学习支持服务的系统及相关解决方案的规划、研发、评估、选型及验收的依据.2提范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款,其中,注口期的引用文件,仅该H期对应的版本适用于本文件:不注口期的引用文件,其最新版本(包括所有的撼改单)适用于本文件。GB/T17235.1信息技术连续色调峥态图像的数字压缩及端码第1部分:要求和指南GB/T33175.2信息技术高效多媒体涮码第2部分:视领GB/T33175.3倍息技术高效多媒体编码第3部分:音频GB/T11867-2022信息技术人工智能术语GB/T-12018-2022信息技术人工智能平
6、台计算资源规莅1SO/IEC1449610信息技术视Wf对象编码第IO部分:先进视频编码(InformationtechnologyCodingofaudio-visualobjects-Pait10:AdYanCedvideocoding)ISO/IEC15948信息技术计竟机图形和图像处理便携式网络图形:功能规范Inbrmaiicntechnology-COmPUlergraphicsandimagewocessing-PortableNetworkGraphics(PNG):FunctionalspccitkationISO/IEC23008-2信息技术异构环境中的高效编码和媒体传输第2
7、部分:掰效视频编码(Informationtechnology-HighefficiencycodingandmediadeliveryinheterogeneousCnvironmcnts-Part2:Highefficiencyvideocoding)ISO/IEC230083信息技术异构环境中的高效编网和媒体传獭第3部分:3D音短(Infor三tiontechnologyHighefficiencycodingandmediadeliveryinheterogeneousenvironments-Part3:3Daudio)3*三*XGBT41867-2022.GBT420182022界
8、定的以及下列术谱和定义适用于本文件.机学习jR4tmachinelearningSyStem能运行或用于开发机潺学习模型、算法和相关应用的软件系统.3.2机习machinekamingfrainework利用预先构建和优化好的组件集合定义模型.实现对机器学习算法封装、数据词用处理和计算资源使用的软件库。3.3机学习,务11uhinckaurningsenior利用机零学习粳型算法及火系统作为I:只为组织或个人提供一种其期望的便利的方式的价值的IT服务.机牌学习算法服务是机潺学习服务的一种,用浓受IH户的应用请求.对输入数据期政风,返网处理结果,3.4帙和tHmodelcompiler将机寄学习
9、校型定义的计算过程转换为使在特定人工招徒计尊资源上执行的代码序列的计算机程序.注r松件中定义的模型印科敞用于机器学习领域,来源:ISO/IEC/IEEE2-4765:2017,3.6813.5资源池resourcepool各类系统贲源的集合体,job机器学习训练或推理任务的逻辑组合.注iT4同k破卜田啊卜某一个资滴6,一个作业包括一个或多个任务。3.7fiMtask实现特定目标所需襄的活动.注:任务用于完成一个相对独立的业务功能.一个任务帆丹I仅展于一个作业.来源:ISO/IEC22989:2022,3.1.35.St4me下列缩略语适用于本文件.ASIC:专用妪成电路(Applicalion
10、-SpcdticIntegratedCircuit)CPU:中央处理瑞(CemralProcessingUnit)DAG:有向无环图(DirCCtCdAcyclicGraph)FPGA:现场J编程逻HHJ阵列(FiekIProgrammableGateArray)GPU:图形处理潺(GraPhiCProcessingUnit)IDE:集成开发环境(InlCgratCdDevelopmentEnvironment)ObjwtNtxalion)StateTransfer)Call)Architecture)JSON:JUVaSCrip(对像注记法UmaScriplREST:表现层状态转换(RCPm
11、SenUUiOnalRPC:远程过IV调用(RCmotCProcedureSOA:flJ版务的架ij(Scrvicc-OricntedSQ1.:结构化CE询语行(StrUetUredQuery1.anguage)XMI.:可扩展五标语?(ExtensibleMarkuplanguage)机港学习系统包含机器学习运行时批件、机器学习框强、机器学习服务组件、工具和运维管理。提itffWin供机器学习应用的开发、训练、部M、运行和管理健力,机器学习系统框架见图1.MM*注I图奥嫡分对应本文件楣彷I定,峻部分仅为创火炉能平伽系统细必不属于本文件规定.5.2 机学习迳行时组件机器学习运行时坦件是为保障机
12、潜学习应用按照预期在特定机器学习系统上运行所必衡的软件环境,包括设备第动软件和兜子际.设爸题动软件负货机器学习各种类型任务的调度与执行,包拈为机罂学习任务分配提供费源管理通道,为应用提供存储管现、设缶管理、执行流管理、事件管理和核函数执行功能。柒子库提供机器学习算法在设得执行调K的呆小计算单元,包括面向机器学习计算任务的通用算子和面向特定设备if算加速任务的优化算子.5.3 机学习楣H机涔学习框架包含模里训练、模型推理及空法限三个模块,为机瑞学习应用开发、优化、验证和部界过程提供工具支撑.模里训练用于机器学习应用设计开发阶段,该模块提供用动微分、损失函数和优化器等两用接.提供模型定义、自动分布
13、式并行调练和多硬件后端玷配等能力.模型推理用机器学习应用的验证部狎阶段,该模块提供模型加我、然调、性能许估和我换等接1,提供模型部??及推理加速等能力.算法库而向机器学习调练、推理和模型性能优化任务.提供预先优化好的算法,以封装函数库的方式供用户说用,提升机器学习模型开发、优化、的证和邮署的效率.5.4 机学习务Ifl件机器学习服务是人工智能行业应用访问、利用机器学习能力和资源的主要方式,机涔学习服务出件支持工作流管理、通用算法模板和双用的号.机器学习系统通过服务组件进行服务部运行环境准备、运行状态汇报和服务容祜等,并提供服务谢川接口,供各衡域上层应刖调用,为满足应用场景的需求,机器学习娱统可
14、提供文本.图像、讦版和视软及其他类型智能化操作的算法服务.&5I*5.5.1 ftMKE*数据管理工具提供人工智能数据的生存周期,包含定义、采集、预处理、模型构建、系统部看、系统维护、数据退出和系统退出的管理能力。提供各类数据源,包括结肉化、半结构化和非结构化数据的接入、标注和旗砥控制,中间数据的管理、最终数据的管理、元数据的管理和数据使用潮源等能力,支持对海收结构化、非结构化数据的顼处理与特征挖掘.&2mnzA模型管理工具提供常用的机渊学习模型及其变形.能按照一定的方式,如算法结构、应用范围,提供模型的分类检索:模型管理工具也可扩展支挣模型导入、导出、更新、发布、迁移和版本控制等功能.在机器
15、学习应用开发阶段通过多模型组合开发、多模型集成超参数设置和模型二次训练等方式支持模型优化与应用开发.开发环境是机器学习全流程开发工具威,支持模型开发、算子开发和应用开发二个主流程中的开发任务,提供模型可视化、算力测试和IDE整机仿真询试等功能.模型编译器将计算过程的计算图和算子转换为环境孜容的中间友达或设备可执行的代码,支持编评优化、编译参数自动寻优、端译结果存储我入、自定义算子注册编译、模型格式转换等功能,&6运维管理提供系统所需的域本运维(例如安装部署、扩展、监控、报警、健康检查、问题及故障定位、升娘和朴丁、得份恢奴和操作审计等)及管理功能(例如计算资源管理、权限管理、用户管理、日志管理、配置管理和安全管理等6功”求&1机学习Mw件机器学习运行时组件的功能要求包括:a)应具备售法程序正常运行所需的基础软件坦件,如设法驱动、通用算子库和操作系统等;b)应具备保障机器学习任务执行所需的设备管理及资源调度能力,包括设备管理、内存管理、事件管理、上下文管理、执行控制、榭礴知与上报等