《基于文档型非关系型数据库的档案数据存储规范.docx》由会员分享,可在线阅读,更多相关《基于文档型非关系型数据库的档案数据存储规范.docx(17页珍藏版)》请在优知文库上搜索。
1、ICS01.140.20A14A中华人民共和国档案行业标准DA/T822019基于文档型非关系型数据库的档案数据存储规范Specificationforstorageofarchiva1.databasedondocument-orientednon-re1.ationa1.database2020-05-01实施2019-12-16发布国家档案局发布弓Ic31范国2术语和定义.3总则-“1234适用性.规范性.开放性.互补性.1.4文档型数据冰字段4. 1字段要求2字段类型.5文档型数据解存储5. 1存储对象5.2存愤方式5. 3存储介质5.4存铺信息管理5. 5存储安全6档案数据导入6.
2、1导入对彖2导入方i3档案数据导入质量控制4档案数据导入的维护.7文档型数据库的拆分与合并1文档型数据座的拆分.2文档型数据库的合并-8档案数据导出.1导出对彖2导出形式3档案数据导出质量控制9文档型数据豚的智份、还原与家兔1文档里数据库的备份“2文档型数据雷的还原-3文档型数据库的恢友10文档型数据库管理与数据管理10.1数据库?3“10.210.310.4数据管理用户管理日志管理附录A(费料性附录)检索附录B(资料性附录)统计分析会考文献7778本标准按照GB/T1.1-2009给出的规则起草.清注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别这些专利的责任.本标准由国家档案局
3、档案科学技术研究所提出.本标准由国家档案局归口.本标准起蔚单位:国家档案局档案科学技术研究所.本标准主要起SS人:&影、陶光毅、张淑前、吕杰、王JB1.刘春阳.陈吉.目前,我国档案部门大都采用关系型数祭眸存便和管理档案数完.关系型数据眸通常将数据存储在二维表中,高度结构化,对数据的规冠性要求高.关系型数据库彼第很好地管理和存镭结构化数据.使用简单、功地强大.非关系型数据库突破了关系型数据库严格的表结构,矫决了关系型数据库模型简甲.不易表达巨杂选送数据结构的问联,存储的数据对象包括非结构化数据、半结构化数据和结构化数据.视处理数据对彖而古,目前非关系型数据库主要有域值存储.列存铺、文档型和图形四
4、大类.本标准基于文档型数据库具备的功链编制.文档型数据库允许创由不同类里的字段,存健任意.格式的数据.在文档獴数据库中,文档是处理信息的St本单位,文档加数据库存楮每个对象的所有信息.并且每一个被存悌的对彖可与任一其他对象不同.采用文档型数据除,能够简单地将不同类型、不同格式的档案数据装入或映射到数据库.从业务角度看,档案数据主要来自于各类业务系统产生的数据和传统戟体档案数字化刖本.每条记录一次写入、多次访问目几乎不可更改,适宜采用文档型数据座存储.文档型数据库与关系里数据库不相互排斥,它们之向可以相互交换数据,从而相互补充、扩展.为了解决大规模档案数据集合多重数据种关带来的挑战,优化档案数据
5、存佬,推动档案数据科学管理,鉴于关系型数据库和文档型数据库各自的特点和优势,档案部门可以将文档型数据库、关系型数据库共同作为档案数据存铭和管理的工具.基于文档型非关系型数据库的档案数据存储规范1范围本标准规定了使用文档型数据库存储档案数据的总体要求,提出了使用文档型数据库存链和管理档案数据的基本功能和实施方法.本标准适用于各级各类档案馆以及机关.团体.企事业单位对档案数据的存储.2术语和定义下列术语和定义适用于本文件.2. 1数据data适合传输、诠程或者手动、自动处邃,以一种规范的方式表达的密实或指令.(GB/T34840.3-2017,A.1注:档案数据包括电子档案的内容数38.传统戏体档
6、案数字化加本的内容数据以及蒋古的元数里(含目录数据.2.2元数据metadata描述电子档案的内容、背震、结构及其管理过程的数据.DA/T58-2014,定义2.162.3内容散据contentdata电子档案和传统绫体档案数字化副本固有的信息.2.4数据库database按照敬念结构组织的数据的汇集,它描述这些数据的特征及与数据对应的实体间的关系并支持一个或多个应用领域.(GB/T5271.2000,定义01.08.052.S关系型数抠库re1.ationa1.database数据按关系模型来组织的数据雷.(GB/T5271.17-2000,定义17.04.05注:关系模型指用二维去的形式去
7、示实体如实体间联乐的收据模生,而一个关系型数据座就是由二惟去及其之间的酸系所组成的一个数施姐织.2.6非关系里!数据库non-Te1.ationa1.database数据不按关系模型来姐织的数宪库.注NoSQU抵非关系S1.戳JS库.非关系如数挺际去栉了关系型效据序的关系型特性,故身之间无关系,没有关系型数据忤严格的小结内.防时可以存健自定义的数38格式.双处理数行对象而言,目前非关浜型政克庵主要右国慎存fi.文相生和图形四大类.文档型效据库允许创建不同类型的字段由信任雳格式的数据.在文档at数纪际中,文档星处理散据的以本班位.2.7结构化数据Structureddata能塔用统一的结构加以表
8、示的数据,或者说能用二维表结构进行逻娼表达的数据.2 .8半结构化数据semi-structureddata具有结构性,但结构变化大,且腐以用结构化数据的处理方法将其放进二维表的数据.示例:XMI文档内容,每项都被一对标记豺记来.5f1.,表面上看是结梅化数据,怛之间的故据却是千变万化,这是舆型的半结构化数拈.3 .9非结构化数据unstructureddata不能用数字或者统一的结构表示的数据,或没有固定结构的数据.这些数据不能用二维去存放.2. 10文档型数据库的拆分document-orienteddatabasesp1.ttng一个数据库被分成若干个数据完整的子数据库.2. 11文档型
9、数据库的合并document-orienteddatabasemerging若干个子数据库合成一个数据完整的数据库.3总则3. 1适用性文档型数妪库应适用于大规模,多种类、多种格式档案数58的存储.备份和管理.4. 2规范性文档金数据库结掏应满足档案数据存懂的要求,使用文档型数据库存储档案数据应将内容数据和元数据按照规范结构装入或映射到数据库中,保蹿两者之间的可*联系.3. 3开放性文档型数据库结构应具有开放性,能与搜索引擎及相关工具软件集成,能与其他类型数据库和系统交换与共享档案数据及相关信息.3.4互扑性基于文档型数据库的档案数据存铭与基于关系型数据库的档案数据存储和管理可形成互补.文档型
10、数据库是内容数据的存铭方法之一,元数据的存储可采用文档型数据库和关系型数据库,日志等的存储和管理宜采用关系型数索库,建立由关系型数据件和文档型数据牌组成的数据比系统.4文档型数据库字段4. 1字段要求文档组数据库应能创建不同类型的字段,存储任意格式的档案数据,并能根据用途和需求变化对字段进行增加,制除和傕改.24. 2字段类型a)b。de)。文档型数据峰字段类型直包括字符由、数值、日期、时间、文本.二进制等,并符合以下规定:字符串字段:用于存铺定长字符串和变长字符串.数值字段:用于存储整数和实数;日期字段:用于存链日期类型数据;时间字段:用于存铺时间类型数据;文本字段:用于存储文本中的句子和段
11、落;二进制字段:用于存储任何类型的字符,包括ASCH字符,以及图像、视频、音频等二进制数据.5文档型数据库存储5. 1存储时象文档型数据库的存储对象包括内容数据等非结构化数据.XMI文件等半结构化数据以及元数据等.6. 2存储方式文档型数据廊存储方式包括:a)将内容数据和元数据全部装入数据豚,技照与元数据的匹配关联关系,内容数据存铺在文档型数据库的二进制字段中;b)将元数每装入数珊比,格内容数据映射到数据座;c)同一数据库可存储多种格式的内容数据,不同记录(行)的内容数据的格式可不同;d)同一条记录可存铺一个或多个内容数据,同一条记录(行)中多个内容数据的格式可不同.1.3 存储介质5. 3.
12、1文档型数据用可存储在横速、固态硬盘.光飘等存储介质上.6. 3.2文档理数据库可在不同的存储介质之间转移.1.4 存储信息管理文档型数据座存储档案数据的过程中,应显示以下信息:一存储档案数据进度和存储完成的信息;一存储过程中出现的问题或错误的佶息.5. 5存傥安全存储档案数据的文档型数据库应保存在安全的存储系统中和存铭介质上,防止被非没权改动数据库存信位置的设置,并保障档案数据不被非授权修改、访问、州除、复制和破坏,对授权修改、访问、删除和爱制要做审计艰踪.涉空档案数据在送存借应加曳,涉密档案数据导出和备份应采取数字签名等安全措施.6档案数据导入6. 1导入对航导入对彖包括内容数据等非结构化
13、数据、XM1.文件等半结构化数据以及元数据等.6.2导入方法6.2.1在线录入数据在税录入是借助录入表单,将内容数据和元数据m接录入到文档型数据库,一次建立一条记录.6.2.2批量导入故据批量导入是按照内容数据与元数据的匹配关联关系,通过导入程序.将内容数据和元数据批量导入文档型数据族.6.2.3导入XM1.文件将XM1.文件和内容数据通过导入程序导入文档型数据库.6.2.4导入数据库数据格关系型数据库中的数据,通过导入程序导入文档型数据库,并将挂接在关系型数据库的内容数据装入或映射到文档型数据座;或将一个文档型数祭博中的数据,通过导入程序导入另一个文档型数娓*6.2.5导入其他系统的数据从我
14、他系统导出的数据按照原有的数据类型和文件格式导入文档型数据库.其他系统包括:一电子档案管理系统;一档案告理的其他相关系统;一形成电子文件的业务系统等.6.3档案数据导入质量控制6.3.1对导入文档型数据球的档案数据的字段类型和文件格式进行设工,并在导入文档型数据眸时按照设施自动进行检音,对不合格的字段类型和文件格式显示提示信息,6.3.2记录档案数据导入文档型数据库的数量.时间、我体、处理人员、格式转换等处理过程相关信息.6.3.3自动监测和过魏错误数据,进行数据完整性校验,日志文件自动记录档案数据导入文档型数据庇产生的错误,对错误显示提示信息.6.3.4对内容数据、元数据田京导入文档型数据库进行识别.6.3.5允许不同归档单位的相同档案数据导入文档型数据库.6. 3.6设置记录档案数据导入文档型数据陈过程的日志,确保能够跟踪、审计、检索(参见附录A).统计分析(参见附录B).6.4档案数据导入的维护档案数据导入的维护包括:a)增加、删除、撤回/恢短、批量修改文档型数据库中的记录;b)增加、出除、修改文档型数据库中记录的内容等.7文档型故据库的拆分与合并7. 1文档型数据库的拆分拆分以记录为单位.拆分的方法包括:a)独立若干个结构相同的子数据库,确定分配给各子数据库的原数据库的起始记录号和终止记录号,从原数据库中提取相应的记录,按,校序将记录导入各子数据库:b)建立若干个结构相同