《雄安新区数据资源目录设计规范.docx》由会员分享,可在线阅读,更多相关《雄安新区数据资源目录设计规范.docx(19页珍藏版)》请在优知文库上搜索。
1、雄安新区数据资源目录设计规范一、概述278()目的278(二)适用范围278(三)规范性引用文件278(四)术语定义279二、数据资源目录280(一)数据资源目录分类280(二)数据资源目录编码281(三)数据资源目录管理283三、元数据要求287()业务元数据要求287(二)技术元数据要求289(三)管理元数据要求292一、概述(一)目的河北雄安新区规划纲要明确提出要“建立健全大数据资产管理体系,打造具有深度学习能力、全球领先的数字城市”。为推动新区构建多层级的数据资源管理体系,探索数据共享授权机制,实现政务数据、位置数据和城市生产、生活、运行数据的底层融合和授权共享使用,制定本导则。(一)
2、适用范围本数据目录通用要求规定了数据资源目录的分类、管理模式、运行模式和总体框架,以及目录建设的元数据要求、功能要求、技术要求和安全要求,适用于雄安新区全区范围内数据资源目录建设的行为及过程。(三)规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注H期的引用文件,仅注H期的版本适用于本文件。凡是不注H期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T21063.12007政务信息资源目录体系第1部分:总体框架GB/T21063.22007政务信息资源目录体系第2部分:技术要求GB/T21063.32007政务信息资源目录体系第3部分:核心元数据GB/T21063.420
3、07政务信息资源目录体系第4部分:政务信息资源分类GB/T21063.62007政务信息资源目录体系第6部分:技术管理要求政务信息资源共享管理暂行办法政务信息系统整合共享实施方案政务信息资源目录编制指南(试行)加快推进落实政务信息系统整合共享实施方案工作方案河北省政务信息资源目录编制指南(试行)(四)术语定义GB/T21063.12007界定的以及下列术语和定义适用了本文件。数据资源:以一定形式记录、保存的文件、资料、图表和数据等各类数据的集合。元数据:描述数据资源属性的数据飞业务元数据:从业务角度描述数据资源各种属性的数据。技术元数据:从技术角度描述数据资源各种属性的数据。管理元数据:从管理
4、协调角度描述数据资源各种属性的数据。数据资源目录:以元数据形式记录、按照一定的分类方法进行排序和编码的一组数据,用以描述各个数据资源的特征,以便于对数据资源的检索、定位与获取。共享库:用于共享和开放数据资源的数据库。标签:用于揭示数据资源内容和特征的标志体。数据挂接:将数据资源与数据资源目录对接的过程。任务调度:将数据使用方的数据获取需求转化为数据交换或数据治理能够识别的数据内容。二、数据资源目录(一)数据资源目录分类1.资源属性分类按资源属性不同,数据资源目录分为部门目录、主题目录、基础目录。(1)部门目录按照资源目录标准,根据资源提供方职能职责梳理形成的资源目录。(2)主题目录是针对某个特
5、定对象或某一业务领域而专门梳理形成的资源目录,如精准扶贫资源目录等。(3)基础目录基础目录是广泛应用的国家基础政务数据,具有基础性、基准性、标识性等特征,主要包括人口基础目录、法人基础目录、空间地理基础目录等。2 .功能分类按流程环节中功能不同,数据资源目录可分为业务目录、数据目录和管理目录。(1)业务目录以资源提供方履行职责过程中的应用视角梳理形成的数据资源目录。(2)数据目录根据业务目录建设共享数据库,并对该共享数据库依据元数据标准进行描述而形成的数据资源目录。(3)管理目录依据数据共享要求形成数据服务调度任务,提供具体数据服务的数据资源目录。3 .层级属性分类按目录所属的层级属性可划分为
6、三类:(1)上级目录指河北省面向全省或者雄安新区提供的数据资源目录。(2)本级目录指雄安新区独立建设的数据资源目录。(3)下级目录指雄安新区下辖行政区划建设的数据资源目录。(二)数据资源目录编码数据资源标识符由前段码(6位数字)、中段码(10位数字和字母)和后段码(5位数字)三部分组成,中段码和后段码之间用字符“广隔开,其形式如图1所示。后段宿分隔符中段码图I数据资源标识符构成前用码1.前段码按照政务信息资源目录编制指南(试行)(发改高技(2017)1272号)中关于政务信息资源代码结构规则的要求,隶属于河北省的政务信息资源的前段码统为330003。雄安新区数据资源的前段码可参照设置,以确保与
7、国家政务信息资源目录的对接。2 .中段码中段码由行政区划代码(6位数字)、部门类别码(1位字母)和部门编码(3位数字)组成。其中,雄安新区行政区划代码为139900,部门类别参考表1(其中A-K对照河北省政府资源目录部门类别),部门编码中参考政府部门代码和企业登记号设置。表1部门类别码表序号部门类别码部门类别名称1A党委2B人大3C政府4D政协5E民主党派6F群众团体7G法院8Ii检察院9J中央驻地单位10K其他政务部门I1.1.公共事业单位12M企业3 .后段码后段码,即数据资源顺序码,是数据资源标识符中对单位所管理或拥有的数据资源进行的唯一标识。后段码共5位,由阿拉伯数字(0-9)组合而成
8、。(三)数据资源目录管理1.参与方数据资源目录全生命周期主要涉及提供方、使用方、运营方和监管方4类参与方。(1)提供方一负责对资源进行目录编制、注册、更新。建立并维护共享信息库。审批数据服务申请。(2)使用方在协议范围内对数据进行使用,并保证数据不扩散泄露。(3)运营方与上级平台级联。对提供方提交的目录进行审核、发布。-审批数据服务申请。一核查目录更新、数据更新。调度服务任务。(4)监管方一查看平台的目录、共享开放等各事项指标结果。2.本级目录本级目录管理与服务流程如图2所示。授供方技术人员运Ir方业务人员提供方业务人员使用评估发布f1.*统计拉接奉仪由触-fU最发布任务调Jr森的。谪*履京人
9、员使用方图2本级目录管理与服务整体流程(1)参与角色本级目录管理与服务整体流程涉及4类参与方的6种角色,具体如下:1)提供方一提供方业务人员提供方技术人员2)运营方运营方业务人员一运营方技术人员一使用方一监管方(2)主要活动本级目录管理与服务整体流程涉及3个环节8项活动,具体描述如下:1)数据准备一编目:数据资源提供方业务人员,以业务视角对资源进行梳理,通过编目工具或编目系统形成业务目录内容:资源提供方技术人员,依据业务目录建立对应的共享信息库,并提取技术特征形成技术目录。注册/维护:数据资源提供方业务人员将目录内容注册至目录链节点,维护共享库数据及目录内容。数据挂接:数据资源提供方技术人员将
10、共享信息库与对应的资源目录进行挂接。一审核:运营方业务人员对注册的资源目录内容进行审核,审核通过可进行发布上架;平分技术人员对数据挂接的技术信息进行审核,审核通过后与资源目录一并待发布上架:发布上架的目录内容变更,需经过审核后重新发布上架。2)数据使用发布:运营方审核通过的资源目录进行发布上架。一服务:使用方通过浏览器等客户端查询目录内容,提交数据获取中请。一任务调度:数据获取申请审批通过后,由平台技术人员调度交换或治理任务,使用方通过任务获取实时或定时的数据服务。3)数据评估统计:对流程中各环节从不同维度定制统计报表,监管方用于数据共享监督考核。3 .上级目录本级目录需与上级目录级联,以获取
11、上级平台数据资源。(1)参与角色上级目录管理与服务流程涉及3类参与方的4种角色,具体如下:I)运营方一运营方业务人员运营方技术人员2)使用方3)监管方(2)主要活动本级目录管理与服务整体流程3个环节7项活动,具体描述如下:1)数据准备一编目:平台技术人员通过级联系统获取资源目录,并通过编目系统提取数据资源的技术特征,形成技术目录,并依据上级平台已经发布的目录编制形成本级业务目录。一注册/维护:平台技术人员将目录内容注册至目录链节点,依据上级平台目录内容的变化维护本级目录内容。一审核:运营方业务人员对注册的资源目录内容进行审核,审核通过可进行发布上架。2)数据使用一发布:运营方审核通过的资源目录
12、进行发布上架。一服务:使用方通过浏览器等客户端查询目录内容,提交数据获取申请。任务调度:数据获取申请审批通过后,由平台技术人员调度交换或治理任务,使用方通过任务获取实时或定时的数据服务。3)数据评估统计:对流程中各环节从不同维度定制统计报表,监管方用于数据共享监督考核。4 .下级目录雄安新区下级目录主要涉及下辖区县,考虑到区县目录可直接放在雄安新区目录下,无需专门建设目录平台,因此下级目录管理与服务流程与本级目录相同。三、元数据要求(一)业务元数据要求业务元数据应包括以下元数据:1 .数据资源名称(数据资源内容的标题名称)2 .内容摘要(对资源内容进行概要说明的文字)3 .注册H期(提供方注册
13、数据费源的H期)4 .提供方一提供方部门/单位:资源提供方部门/单位全称,不可使用简称。提供方部门/单位联系人:资源提供方部门/单位联系人姓名。一提供方部门/单位联系人电话:资源提供方部门/单位联系人电话。5 .提供方代码(资源提供方部门/单位代码)6 .资源标识符(数据资源唯一不变的标识编码)7 .资源技术支持一资源技术支持部门/单位:资源技术支持部门/单位名称。资源技术支持联系人:资源技术支持联系人姓名。一资源技术支持联系人电话:资源技术支持联系人电话。8 .资源分类分类方式:资源所采用的分类方式。一分类类目:分类方式中的类目名称。9,共享类型(数据资源共享类型包括无条件共享、有条件共享和
14、不予共享三类)。10.开放类型(数据资源开放类型包括无条件开放、有条件开放和不予开放三类)。I1.数据项-数据项名称(数据资源中具体数据项的标题)。一数据项共享类型(数据资源中数据项共享类型包括无条件共享、有条件共享和不予共享三类)。数据项开放类型(数据资源中数据项共享类型包括无条件开放、有条件开放和不予开放三类)。12 .共享方式:数据采用的共享方式,包括数据交换、接口服务、文件下载。13 .数据更新周期(实时、每天、每周、每月、每季度、每半年、每年)。14 .标签(用于标识资源内容的通用词、形式化词或短语)。(一)技术元数据要求技术元数据应包括以下元数据:1 .技术资源名称(技术资源内容的名称,可以是系统名称、表名称、文件名称、文件夹名称,也可以根据资源内容提取)。2 .数据格式类型(资源数据的格式分类,包括数据库、电子文件、电子表格、数据接口、图形图像、视频媒体、自描述格式)。数据库.数据库类型:可用于共享的数据库类型。.数据库地址:可用于共享的数据库地址。.数据库用户名:可用于共享的数据库用户名。.数据库密码:可用于共享的数据库密码。.表中文名称:可用于共享的数据库表中文名称。.表英文名称:可用于共享的数据库表英文名称。.字