《中文网络信息保存体系探讨.docx》由会员分享,可在线阅读,更多相关《中文网络信息保存体系探讨.docx(7页珍藏版)》请在优知文库上搜索。
1、中文网络信息保存体系探讨钟常青(湘潭大学图书馆,411105)杨道玲(武汉大学信息管理学院,430072)文摘:网络信息保存体系是一种解决与网络信息资源保存相关的一系列问题的整体方案。本文首先简要介绍了构建网络信息保存体系的背景与意义。然后作者提出,在建立中文网络信息资源保存战略体系时,应该从宏观上研究保存中的4个基本模块:保存目的、保存主体、保存对象、保存方法。关键词:网络信息长期保存体系ThePreservationSystemofChineseWebInformationZhongChanging(LibraryofXiangTanUniversity)YangDaoling(Schlo
2、fInformationManagementofWuhanUniversity)AbstractThePreservationSystemofChineseWebInformationisthewholeprojectforsolvingaseriesofproblemsaboutwebinformationpreservation.ThisarticlefirstlyintroducesthebackgroundandsignificanceofChinesewebsiteinformationpreservation.Andthentheauthorputsforwardfourindis
3、pensableelementsfordevelopingthestrategyofpreservingwebsiteinformation,thatisthepreservationaim,subjectofpreservation,prese,ationobject,preservationsolutions.KeywordsChinesewebInformation;Long-termpreservation;Preservationsystem1引言随着计算机和通信技术的飞速发展,网络已成为我们这个世界重要信息源之一和主要的信息传播媒介。作为全球最大的信息资源库,网络信息资源日益成为我
4、们文化遗产的重要组成部分。随着我国互联网基础建设投入加强,网络需求亦步入成熟期,近年来中文网络信息资源增长速度惊人。统计表明:截至2005年12月31日:我国网上资源增长更加迅速,网页总数约为24.0亿个,同期相比增幅为269%。网页字节总数约为67,300GB,一年内增长46,763GB,同期相比增长率达到227.7%。这些数据充分表明,我国网络信息资源的发展势头十分强劲,在数量、质量和服务方面都取得了新的进展。而且网页更新频率相当高,一周以内更新的占10.36%,一至三个月内更新的占56.72%。但同时,这些中文网络信息资源又存在以下问题:(1)资源良莠不齐,影响利用;(2)重复率高,造成
5、网络负担;(3)杂乱无章,查找困难;(4)保存不力,重要资源流失。中文网络信息资源的这些特点给保存工作带来了极大的挑战:如何确定保存对象、选择保存内容,才能更好地囊括中华网络文化遗产?如何确保保存工作经济可行?如何处理相关的法律问题?以及建立怎样的保存协作体系?等等。中文网络信息保存是一项大的系统工程,它涉及到文化、经济、技术、法律、管理等诸多方面的问题,需要政府、新闻出版、教育、科技、文献保存等许多部门和单位的紧密合作,这仅仅靠技术手段是远远不够的,更需要从宏观的角度构建网络信息保存的战略体系。目前,我国已经启动几个保存网络信息资源的项目,但都还处于初步探索阶段。它们大多从技术的角度考虑如何
6、采集与保存网络信息资源,但很少从宏观战略的角度来考虑中文网络信息资源的保存体系问题。有鉴于此,结合中国电子政务及中文网络发展的实际,我们认为:目前最迫切的任务是从宏观角度较为系统的探讨中文网络信息资源保存体系,以便有本文是2007年湖南省教育厅课题“中文网络信息资源保存体系研究”的成果之一。组织有计划地构建一个国家中文网络信息资源长期保存的协作网,对中文网络信息的创建、流通、维护与存档进行严格的监管。2中文网络信息保存体系构成分析网络信息保存体系是一种解决与网络信息资源保存相关的一系列问题的整体方案。我们构建中文网络信息保存体系的目的是建立一套网络信息保存的宏观框架,将与网络信息保存的各方面的
7、问题都纳入这个框架体系之中,并最终以指导原则或方案的形式指导保存实践,以便最全面、最经济、最合法、最有效的实施对网络信息资源的长期保存。所以,在构建中文网络信息保存体系时应该遵循宏观性、通用性、实用性的原则。根据该原则,并通过对国内外相关实践的研究网,结合中文网络的实际情况,设计网络信息资源保存体系的基本模块,如下图所示。即应该从宏观上研究如下4个纬度的问题(即“4W”):为谁保存(Whom)、谁来保存(Who)、保存什么(What)、如何保存(How),2.1为谁保存(Whom):保存目的在进行网络信息保存活动之前,需要明确保存目的。保存目的的确定需要分三个步骤:(1)用户需求分析确定保存网
8、络信息是满足哪些用户群体的需要,满足哪些方面的需要;并且在进行需求分析时不能仅仅局限于目前的需求,还要考虑到未来研究我们今天的历史时的需求。只有确定了当代和未来对保存网络信息的需求,才能更准确地设定我们的保存目标。(2)确定总体目标根据需求分析来确定保存活动的总体目标。笔者认为对于中文网络信息资源保存来说,我们的总体目标应该是:尽可能地保存已有的中文网络文化遗产,为当代和后代服务。(3)阶段性任务要实现总体目标,我们还必须设定每个阶段的具体目标或任务。当前我们进行中文网络信息保存的任务是:研究中文网络信息的特点,充分吸收和借鉴国内外的研究与实践成果,探索适合我国国情的保存策略与方法,并制定中文
9、网络信息保存工程的规划与规章,以确保这项事业的长期顺利进行。2.2 谁来保存(Who):保存主体目前,缺乏专门的机构对整个中文网络信息保存负责,也没有统一的政府级别的组织来制定采集标准或网络保存策略。因此,各自为政的现象极为普遍,许多文化收藏机构都在积极探索网络信息保存问题,包括档案馆、艺术馆、国家图书馆、博物馆等等,甚至是网站所有者本身。这就形成了一种相对分散的保存局面,各个保存行动的采集策略和采集内容都有很大的差别,如果没有一个统一的组织来引导其合作,势必造成两种后果,一是大量的重复采集,造成人力、财力的浪费;二是会有许多中文网络信息因相互推诿贡任而得不到及时采集,造成重要文化遗产的流失。
10、到底由谁来负责中文网络信息资源的长期保存?是由信息的产生者还是出版者,或是传统的文献保存机构如图书馆、档案馆,抑或是他们合作来实施保存职责?如何确定保存主体,划定各方的保存责任并确保其贯彻实施,是制定保存战略必须紧迫解决的问题。因此,对于本模块,需要重点解决三个问题:(1)确立中文网络信息保存的组织模式与领导机制目前,国际上网络信息保存的组织模式主要有集中式和分散式两种。如英国艺术与人文科学数据服务部就是采取集中式保存策略,而澳大利亚、美国的很多保存项目都是采取分散模式。国际图书馆与信息资源委员会(CIJR)认为“分散式保存模式已经不适合于数字时代的保存,而应该采取集中式的大规模的保存方式而C
11、PA与RLG在1996年发表的联合报告认为:“目前可行的办法是建立一个分散的、而不是集中的保存框架”。笔者认需求分析保存目的总体目标阶段性任务组织与领导保存主体责任体系合作模式确定保存级别保存范围保存对象采集方式采集频率采集原则采集范围采集技术长期存取技术技术安全访问控制元数据管理法律知识产权法呈缴法其他相关法规保存方法成木/效益分析动机与激励机制经济构建经济模型探索资金方案宏观管理政策内部管理机制管理为,到底采取哪种模式,应结合网络信息的分布特点以及保存机构合作模式来确定。关于保存活动的领导者问题,联合国教科文组织在2003年颁布的数字遗产保存宪章中指出:尽管数字保存必须在合作的基础上进行,
12、但必须有相应的机构来承担领导职责。国内有学者指出:“既然国家图书馆拥有法定权利去获得和保存该国出版的文化财产,并且大多数国家图书馆目前也在进行获取数字出版物的实践,因此国家图书馆,以及其他主要图书馆和机构,应该在网络信息资源的长期保存中起领导作用。”(2)建立网络信息保存的责任体系,划定各方的保存职责2002年6月,国际图联(IFLA)与国际出版协会(IPA)联合发表了一个声明,声明指出:“出版机构承诺短期保存他们出版的数字形式的出版物,而图书馆则应通过与出版机构协商,承担起长期保存这类出版物的责任”;“各国的国家图书馆是获取和保存各国这类形式出版物的最佳场所,实际上许多国家图书馆也正在从事这
13、项工作,国家图书馆与其他一些主要图书馆和图书馆组织应该担负起长期保存数字信息的主要责任”;“出版机构和图书馆工作小组将进一步开展有关数字信息保存方面相关的技术、经济和政策问题方面的合作,其中包括在合适的条件下成立与其他相关组织协同工作的统一机构J该声明的发布,对我们划分保存责任具有极大的借鉴意义。(3)探讨可行的合作模式这里的合作不仅是技术、保存内容方面的合作,还包括不同体制、系统以及地域之间的配合与协调,因此必须从深层次理解合作精神。一是积极参与国际合作,包括制定统一的标准、参加有关国际会议,或者直接参与国际Web保存项目。通过合作,可以充分吸收和借鉴国外的优秀经验、管理模式以及先进技术。二
14、是国家文献保存机构之间的通力合作。如图书馆、档案馆、博物馆等,是我国主要的文献收藏机构,相互之间可以也应该进行协调,技术上合作攻关、资源保存上合理分工、资金上实现最佳分配,这样不仅可以节省人力、物力,避免重复建设;而且也有利于保存体系的完整与优化。三是保存机构应与网络信息出版者、IT界、法律部门等保持密切联系与合作,建立多学科、多行业合作的平台。共同探讨与保存网络信息相关的管理问题、法律问题与技术问题,以便达成共识和建立协调合作的平台;同时也要借助各方面的专业技能来解决不断涌现的新问题。2.3 保存什么(What):保存对象保存对象的选择在整个保存体系中至关重要。所谓“选择”,就是及时挑选网络
15、上值得保存的信息资源,并通过各种方法进行收集与归档,以备当代和后代人利用。网络信息选择是整个网络信息保存工作的首要环节,“选择原则”决定了网络信息的最终命运:留存或者遗弃。与传统资源的选择工作相比,网络信息选择涉及的问题更为复杂,难度更大。因而,制定合理的网络信息选择策略对人类记忆的留存与防止智力资产的流失是极为关键的,目前世界各国都在为此积极探索。保存对象的选择,说到底需要解决三个根本性问题:(1)确定保存范围包括确定采集级别、归档网络空间划定以及制定内容选择原则等问题。具体来说,首先确定采集级别,采集级别一般分为档案级、服务级与链接级。保存目的不同,采集级别也会不同,那么采集的策略与要求也会变化;然后划定归档网络空间,即划定哪些网站应属于采集范围;由于网络信息的庞杂性,具体到每个网站内部,需要制定网站内容的选择原则,明确到底哪些资源值得保存,哪些不需要保存。(2)选择采集方式保存对象的选择与采集方式极为相关,使用不同的采集方式,结果采集的内容也会不同。纵观各国的网络信息保存行动,主要有5种采集方式:捐赠、呈缴、选择性采集、全采集、联合方法等。其中,前两种是被动的获取,后面三种是主动的获取方式。我们需要结合中文网络信息的特点,提出适合的采集方案。(3)确定采集频率网络一直处于不断变化、更新的动态环境之中,新的网页不断产生,旧的网页也在不断地消失。由于各个网