我国数字档案馆与电子文件中心建设

发布人:钱杰生  发布时间:2014-01-10  浏览次数:1295

一、数字档案馆在中国:理想与现实的差距

我国数字档案馆建设早期,档案界在对数字档案馆概念界定和功能分析中,对其无障碍的跨库资源共享的强大功能寄予了厚望,如何嘉荪教授认为:“数字档案馆不仅仅是馆藏得到数字化以及管理工作实现了信息化的档案馆和档案馆群体;它实质上是一个通过计算机互联网络有序处理和集成管理在结构各异的多种信息平台上产生的多样的电子文件、档案以及其他信息,确保这些数字信息资源的真实性、完整性和持久有效性,并实现上述信息资源跨库共享的超大规模、分布式和可扩展的数字信息系统”。[i][1]与何嘉荪教授的观点类似,冯惠玲教授认为,“数字档案馆是采用现代高新技术所支持的数字档案信息系统,是档案信息组织模式,代表的是一种信息环境和基础设施构建,是超大规模的,便于使用的、没有时空限制的知识信息中心”。[ii][2]何嘉荪和冯惠玲教授对于数字档案馆的认识在中国具有典型代表性,即认为数字档案馆是一个功能强大的超大的分布式档案信息系统或知识信息中心,最终目的是实现档案资源共享。此外,其他众多档案界人士也发表了自己的看法,认为“数字档案馆是用二进制编码的数字方式存储、处理档案信息内容,应用计算机、通讯和多媒体技术,提供电子网络检索和服务的档案信息系统,它是一个有序的信息空间,一个开放的信息环境”。[iii][3]“数字档案馆是一个电子化信息的仓库,能够存储大量各种形式的信息,用户可以通过网络方便的访问它,以获得这些信息,并且其信息存储和用户访问不受地域限制,它能把包括多媒体在内的各种信息的数字化、存储管理、查询和发布集成在一起,使这些信息得以在网络上传播,从而最大限度地利用这些信息”。[iv][4]“数字档案馆是一个数字化的信息系统,它将分散于不同载体、不同地理位置的信息资源以数字化方式存储,以网络化方式互相连接,从而提供及时利用,实现资源共享”。[v][5]“数字档案馆是以电子文件管理系统为主体,通过网络对电子文件等数字化档案信息实现管理与服务的虚拟档案机构”。[vi][6]此外,李国庆认为,数字档案馆的含义有广义和狭义之分,广义的数字档案馆是指存储和利用档案信息资源的信息空间,是一个由众多档案资源库群、档案信息资源处理中心、档案用户群构成的数字档案馆群体,是一个以有序的信息空间和开放的信息环境为特征,面向对象的分布式网状结构模式。狭义的数字档案馆指其中的个体档案馆,其功能包括信息采集、整理、存储、检索、传递、保管、保护、利用、鉴定和统计等全过程,代表的是一种信息环境和信息基础设施。[vii][7]

从以上关于数字档案馆概念的定义来看,我国绝大多数档案学者倾向于将数字档案馆界定为一种“信息系统”或“信息空间”,实质上是将所有类型的档案信息囊括其中的基于数字化存储和网络化存取的信息空间。这种认识基本把握了数字档案馆的本质,同时也反映了人们对于数字档案馆能够最广泛、最大限度地实现档案信息资源共享的美好愿望。

但现实不容乐观。数字档案馆建设所需要的技术条件、经济条件和法律制度在我国还比较欠缺,有待完善。首先,在技术条件方面,数字档案馆建设是一个系统工程,需要多项关键技术支撑,包括数字档案信息生成技术、数字档案标引技术、数据压缩及海量数据存储技术、数据挖掘技术、自动分类及智能检索技术、数字档案的安全保护技术,以及系统体系结构所涉及的中间件技术,等等。但仅就档案标引技术而言,长期以来,我国档案著录和标引的效率较低,质量不高,主要以人工标引为主,自动标引技术中涉及的汉字词自动切分技术尚未寻找到最优的解决方案,从而造成了档案数据准备的颈瓶,影响了档案数据库生产的规模和速度。其次,在经济条件方面,我国东西部经济发展不平衡,深圳、上海、北京、天津、青岛等经济发达地区的数字档案馆建设有充足的地方财政支持,而中、西部地区的数字档案馆建设则普遍存在资金缺口。再次,我国数字档案馆建设所需要的基本法律制度和标准体系尚待完善和加强。我国已有的与电子文件和数字档案馆有关的主要法律法规有:《档案法》(1987,1996)、《电子签名法》(2004)、《电子公文归档管理暂行办法》(2003),档案工作国家标准有:《CAD电子文件光盘存储、归档与档案管理要求 第一部分:电子文件归档与档案管理GB/T17678.1-1999;第二部分:光盘信息组织GB/T17678.2-1999》,《电子文件归档与管理规范》(GB/T 18894-2002),《中国档案机读目录格式》(GB/T 20163-2006),档案工作行业标准有:《纸质档案数字化技术规范》(DA/T 31-2005)、《公务电子邮件归档与管理规则》(DA/T 32-2005),等等。此外,2008年国家档案局相继制定推出了三项档案行业标准的征求意见稿:《电子文件元数据标准》(征求意见稿)、《电子文件管理细则》(征求意见稿)和《数字档案信息输出到缩微胶片上的规定》(征求意见稿)。从时间上看,上述法律、法规和标准大多出台于2002年以后,比较新;从内容上看,基本是关于电子文件管理的国家规范和标准,而关于数字档案馆的系统设计、功能定位及信息服务等方面的标准明显缺失。

由于经济技术条件的限制,社会信息化发展水平的制约,以及法规、标准的缺失或滞后,我国数字档案馆建设进展缓慢。现阶段我国国家级的数字档案馆的建设模式还没有出台,数字档案馆建设暂时处于自下而上的实验摸索状态。我国的数字档案馆工程从2000年开始,经过8年的发展,在总体上仍停留在馆藏数字化和建立档案网站阶段。数字档案馆建设基本属于狭义的个体数字档案馆建设范围内,离真正意义上的具备电子文件在线存取和长期保管功能,实现信息资源跨库共享的超大规模、分布式和可扩展的数字信息系统的理想还相当遥远。因此,很多机构在数字档案馆建设过程中确立了“两步走”的发展策略,首先,确立和实现近期目标,建立分布式档案基础数据库和电子文件中心,其次,再在此基础上建设数字档案馆。

二、当前我国数字档案馆建设的特点

 

我国数字档案馆建设具有如下特点:相对独立性、与电子政务关系密切、模式多样性、数字档案馆建设具有地区不平衡性和阶段性。

(一)相对独立性

国外的档案工作与图书工作关系密切,很多图书馆藏有珍贵的历史档案,因此档案数字化往往是与图书馆数字化同时进行。在OCLC等国外很多大型检索系统内我们可以看到,数字化档案、手稿与图书、地图、期刊以及音像制品已经集成管理并统一提供利用。著名的美国电子文件档案馆项目(ERA)以OAIS、InterPARES、DOCT等6个大的合作项目为核心,是档案部门与科技界、政府部门、IT界和图书馆界广泛合作的典型。

我国的数字档案馆都是在档案系统内独立开发的,与图书馆没有合作的传统,鲜有与图书馆界、科技界和IT界广泛合作的先例。这对于档案馆来说是一个很大的挑战,需要自行设计和建设独立的数字档案馆,由于资金、技术和人才等方面因素的限制,不可能在短时期内建成。目前很多数字图书馆项目基本处于馆藏数字化和档案网站建设阶段,档案馆网站的信息内容有待充实,许多档案馆还在进行数据准备和录入工作,而对于电子文件的接收则由于法规标准的缺乏或电子文件管理系统本身的不完善没有真正开展。我国数字档案馆建设的独立性虽然有利于建设独具特色的数字档案馆系统,但与图书馆界、科技界和IT界的隔离不利于汲取先进的技术和方法,也不利于社会公共信息资源的集成和共享。

(二)与电子政务关系密切

我国电子政务的发展开始于20世纪90年代,逐步由政府上网公开政务信息阶段发展到网上办公阶段。电子政务为数字档案馆和电子文件中心的建设提供了十分难得的契机,在经费、技术和资源上成为数字档案馆和电子文件中心建设的最重要支撑。相应的,现阶段数字档案馆和电子文件中心担当了电子政务数据中心的重要角色。

随着电子政务工程的推进,电子政务环境中产生的电子文件管理问题日益受到关注,国家档案局高度重视电子政务活动中电子文件的归档和长期保存问题,于2007年开始研制电子文件管理的国家战略,并促成了全国省、市级综合性档案馆纷纷设立电子文件中心。电子文件中心的一项基本职能是接收和保管电子政务活动中形成的现行电子文件,为政府各项活动和决策提供信息支持。同时,电子文件中心可以在政府和档案馆之间发挥中转站的作用,最终成为数字档案馆工程的一个有机组成部分。

(三)模式多样性

我国档案馆主要有三种类型:综合性档案馆、部门档案馆和企业档案馆。它们在数字档案馆的建设过程中不可能采取统一的模式,这是由它们各自不同的服务范围和社会性质所决定的[viii][8]。综合性档案馆的馆藏最丰富,服务范围和对象是整个社会公众,承担着保护社会记忆,传承人类文明的历史重任,其社会性最强,因此,在数字档案馆模式选择中需要充分发挥其社会性和公共性。而部门档案馆主要服务于专业系统或部门内部,主要是科技档案等专门档案材料的存取和利用,其服务面相对狭小而且具有行业和专业特色。企业档案馆的馆藏来源于本单位,仅为本单位服务,服务范围最小,专业性也很突出,必须考虑为企业的经济效益服务。因此,不同类型的档案馆具有不同的规模、服务范围和社会性质,它们的数字档案馆建设在总体规划、功能设计、运行机制等方面存在明显差异。在宏观管理层次,国家档案局已组织了若干相关课题推动数字档案馆的建设工作,但全国统一规划尚未完成。[ix][9]

(四)地区发展的不平衡性

数字档案馆产生于发达的信息社会,它需要大量资金投入以及现代高新技术的支撑。我国东部沿海地区和中西部地区在经济、文化和技术等方面的实力相差悬殊,数字档案馆的建设必然存在地区不平衡性。从已经开始的数字档案馆项目来看,东部地区占了绝大多数,而中西部地区的很多档案馆由于各方面条件限制无法启动数字档案馆项目。

(五)建设过程的阶段性

数字档案馆建设必须以档案馆业务工作自动化为基础,认为在数字档案馆建设过程中可以实现跨越式超常规发展的想法是不切实际的。数字档案馆建设一般需要经历以下三个阶段:

第一个阶段:档案馆自动化阶段。实现档案实体管理和档案信息组织的自动化。

第二个阶段:单个数字档案馆建设阶段。主要包括馆藏数字化、档案数据库建设和档案网站建设,并能够实现对电子文件的远程存取。

第三个阶段:多个数字档案馆互联阶段。实现多个数字档案馆之间的互操作,以各个数字档案馆共同遵循的高层协议为基础,整合各个档案馆的资源并提供统一的检索入口。

我国大部分省级以上的综合档案馆,国家专业系统和大型企业的档案馆,以及有关高校的档案馆已经具有了档案自动化的基础,馆藏数字化工作正在持续进行,目录型和全文型数据库也在纷纷建立。全国90%以上的省市档案机构已经建立了档案网站,经国家档案局批准,中国档案报社主办的中国档案系统的龙头网站——中国档案网已经于2007年7月开通。

总体上,我国东部发达地区的数字档案馆建设处于第二阶段即单个数字档案馆建设阶段,而中西部地区的数字档案馆建设还处于由第一阶段向第二阶段的过渡期。

三、电子文件中心——我国数字档案馆的重要组成部分

(一)电子文件中心的产生及性质

电子政务及政府信息公开政策的推行,催生了电子文件中心。电子文件中心产生的直接原因是满足电子政务对电子文件的集中管理、安全保护和实时利用的需求。在电子政务环境下,电子文件的集中管理、保存和利用问题日趋突出。根据国家档案局2006年组织的一次调查结果显示,中央和国家机关、中央企业已有将近80%的单位采用了办公自动化或电子政务系统,共已产生各种类型电子文件近2亿件,成为各项工作真实记录的重要组成部分。在中央和国家机关层面,目前产生的电子文件种类复杂、格式多样,已经高达数十种;操作系统、自行开发的应用系统多种多样,也有几十种;电子文件管理的责任部门不统一,接近50%的电子文件由档案部门管理,其余的由信息技术部门、文件管理部门、业务部门或者几个部门共同管理。由此带来的电子文件运行管理中出现的安全保管、长久流传、共享利用等问题,直接影响到了国家数字记忆的保存和电子政务效能的发挥。[x][10]在此背景下,电子文件中心应运而生,它是一个能够实现在线接收、保管和存取的电子文件管理机构,是在政府电子文件数量急剧增加的推动下,顺应电子文件保管和利用的需要而建立起来的电子文件保管和利用中心。

我国首家电子文件中心是2004年12月28日建成的江苏省常州市电子文件中心。《江苏省档案信息化建设规划纲要(2005-2010年)》明确提出了“2008-2010年,全省100%的国家综合档案馆全面建成与电子政务相配套的电子文件中心”的目标。[xi][11]目前,江阴市、安徽省、天津市、上海市、江苏省、安徽省、山东省、广东省、四川省、陕西省等全国十多个省市都已经建立了电子文件中心。电子文件中心在全国有迅速扩展之势。

电子文件中心不是一个独立的实体机构,它挂靠于政府的电子政务网络平台,往往由横跨若干部门的成员合作开发,并由一个相对固定的团队来主持和维护,是各级国家档案馆的内部组织部分。[xii][12]电子文件中心负责制订统一的电子文件交换格式和存档格式,对所属单位政务活动中产生的具有保存和利用价值的各类电子文件实行集中管理和保存,辅助党政机关办公和决策,并向社会提供政府现行文件的阅览和查询服务,保存“电子化的历史”。[xiii][13]根据其功能和目的,可分为半现行电子文件中心和现行电子文件中心。半现行电子文件中心是为处于半现行阶段的电子文件而专门建立的文件管理和利用中心;现行电子文件中心基于电子政务网络平台,是政务工作的附属和延伸,其实质是网上的“现行文件阅览室”。我国目前的电子文件中心多属于后者,即现行电子文件中心。[xiv][14]

(二)电子文件中心对数字档案馆功能的重要补充

我国的数字档案馆和电子文件中心不是同时出现,而是先后出现的。数字档案馆建设开始于2000年,电子文件中心设立开始于2004年。数字档案馆建设内容包括两个方面:持续进行的大规模的馆藏数字化工作,以及档案网站的建设和信息发布工作。但电子文件的在线接收和存取服务由于相关法规、标准和技术等方面条件的限制一直未能开展,而代之以同时移交和保存同一文件电子版和纸质版的“双套制”,显然,“双套制”对移交机关和档案部门都造成了负担,也不利于电子文件的实时利用和发布。我国数字档案馆从开始建设至今,一直未能妥善解决电子文件在线接收和存取的问题,而电子文件中心的出现则使这一问题的解决出现了希望。

电子文件中心应拥有自身的相对独立性,它的主要功能是在线接收和保管电子政务活动中产生的现行文件,并提供公共利用。[xv][15]电子文件中心应该纳入数字档案馆系统,它是数字档案馆的前端和入口,是连接数字档案馆与电子政务各系统连接的桥梁和纽带。因此,电子文件中心建设和数字档案馆建设一定要在流程、标准、技术、软件设计、硬件配置等方面相互衔接、相互匹配。[xvi][16]

综上所述,我国数字档案馆建设在现有的经济、技术和管理条件下具有自己的特色。通过分析我国数字档案馆建设的现状、特点和典型模式,以及电子文件中心在数字档案馆建设中的作用,我们可以得出如下4条结论:

第一,各类型数字档案馆建设不可能遵循统一的模式,但国家综合性数字档案馆的基本建设标准应该适时出台。数字档案馆有着从个体到群体的建设发展阶段,个体发展时期很难统一模式,而我国正处于个体数字档案馆建设阶段,所以很难遵循统一的模式。但在数字档案馆的系统框架和功能需求方面,国家综合性数字档案馆项目对于数字信息的长期保存和提供利用应该有更高的、统一的标准和要求。

第二,我国数字档案馆建设必须实行分步走的策略。数字档案馆应具备电子文件在线存取和长期保管功能,建立分布式和可扩展的数字信息系统,最终实现信息资源跨库共享。受制于我国的经济、技术和法制条件,这种功能和目标不可能一蹴而就,必须实行分步建设的策略。首先,实行馆藏数字化、建立档案信息数据库和档案信息上网,其次,解决电子文件的在线存取问题。最后,建立多个数字档案馆之间的联盟。

第三,借鉴数字图书馆建设的经验和成果,采用已有的先进、成熟技术。我国的数字图书馆工程比数字档案馆开始早,技术力量雄厚,数字图书馆建设中的许多技术如数字化技术、海量存贮技术、信息标引和检索技术、信息安全技术等都可为数字档案馆建设提供借鉴。

第四,及时制定我国数字档案馆建设标准,并与国际标准接轨。应积极引进国际标准0AIS(Open Archival Information Access ,ISO:14721),设计数字档案馆的系统框架和元数据框架。OAIS不仅具有一般数字信息管理系统的功能,如接收、数据管理、存取和公共服务等功能,更重要的是,它具有十分强大的针对数字信息长期保存的功能,包括:行政管理(含各种政策)、档案存储和保存计划,这就为数字信息的长期保存提供了依据。目前中国数字档案馆建设基本是各自为政,在数字信息长期保存的功能设计和元数据框架方面尚无统一的国家标准,应建立基于OAIS的中国数字档案馆国家标准。   

注释:  

  [xvi][1]何嘉荪:《保存电子文件背景信息的重要手段———再论全宗、案卷形态的异化》,《档案学通讯》,2001(5):43-47

  [xvi][2]冯惠玲,张辑哲主编:《档案学概论》.北京:中国人民大学出版社,2001

  [xvi][3]张晓霞,王宇晖,王萍:《数字档案馆——21世纪档案馆的新发展》,《兰台世界》,2000(1):19-20

  [xvi][4]傅荣校:《关于数字档案馆的思考》,《档案学通讯》,2001(5):26-28

  [xvi][5]王宇晖:《21世纪数字档案馆发展之我见》,《档案与建设》,2000(3):4-5

  [xvi][6]赵屹,陈晓晖:《对数字档案馆的简单认识》,《档案学通讯》,2003(5):38-41

  [xvi][7]李国庆:《数字档案馆概论》,北京:中国档案出版社,2003,p10,28

  [xvi][8]傅荣校,陈荣红:《数字档案馆模式研究——现阶段不可能有统一模式》,《档案学通讯》,2005(4):44-47

  [xvi][9]邱晓威:《数字档案馆及其建设模式》,《中国档案》,2001(10):38-41

  [xvi][10]张建辉:《全国电子文件中心建设经验交流会记实》,《电子政务》,2007(6):88-89

  [xvi][11]张照余:《开展电子文件中心研究势在必行》,《浙江档案》,2005(8):4-5

  [xvi][12]冯惠玲:《综合档案馆电子文件管理项目的功能定位》,《档案学通讯》,2007(6):69-73

  [xvi][13]王萍:《电子政务环境下电子文件中心问题研究》,《档案》,2007(3):6-8

  [xvi][14]张照余:《电子文件中心引论》,《档案学研究》,2005(4):7-10

  [xvi][15]何嘉荪:《现行文件阅览中心、文件中心与数字档案馆》,《档案学研究》,2003(1):32-35

  [xvi][16]邱晓威:《电子文件中心的建设及其发展问题的分析》,《中国档案》,2006(12):9-10

  [作者简介]肖秋惠,管理学博士,武汉大学信息管理学院档案与政务信息学系副教授,副主任。

(武汉市 武汉市,邮编:430072 )

(作者: )