数字档案馆:内涵与理论体系建设

发布人:钱杰生  发布时间:2014-01-10  浏览次数:1280

华东师范大学档案馆馆长朱小怡

一、数字档案馆的概念与内涵

数字档案馆是21世纪档案事业发展中一个全新的命题,也是近年来档案界广泛使用的一个概念。二十世纪初,随着电子政务、电子商务、数字化校园的快速发展和数字档案资源的与日俱增,数字档案馆研究初见端倪。欧美等发达国家纷纷投资建设。其中比较有影响的项目有美国的电子文件档案馆、英国的联合王国数字档案馆和日本的关西数字档案馆等。国内,一些国家综合档案馆和企事业单位档案馆也开始付诸行动,并取得一定的成效。例如深圳市数字档案馆、青岛市数字档案馆、江苏省电力公司数字档案馆和浙江大学数字档案馆等。“十一五”期间,全国各地、各行各业还会启动更多的数字档案馆建设项目。

虽然社会快速发展的信息化进程决定了数字档案馆建设发展的必然性。但是,时至今日,不同的数字档案馆建设项目仍然按照各自的理解在使用着数字档案馆的概念。这将会对数字档案馆理论与实践造成一定的负面影响。因此,本文试图结合工作实践,对数字档案馆的概念及内涵再作一些系统的研究与探讨,以期通过进一步的研讨,促进对数字档案馆内涵的共识。

(一)数字档案馆定义研究概述

与数字图书馆建设初期一样,20世纪90年代末,电子档案馆(Electronic Archives)、虚拟档案馆(Virtual Archives)、没有围墙的档案馆(Archives without Wall)、全球档案馆(Global Archives)、超级档案馆(Hyper Archives)、数字档案馆(Digital Archives)等新名称不断见诸报刊。但是,随着数字图书馆从概念变成现实,档案界对于数字档案馆的表述也渐趋统一。

然而,对于不同的研究者而言,数字档案馆仍然有着不同的内涵。档案界、计算机界、国际标准组织机构以及档案用户等,都在试图从不同的角度来阐述这一概念。

1、信息系统论

信息系统论是当前档案界对数字档案馆概念描述中的一种主要提法,其核心是将数字档案馆定义为一个超大规模的“信息系统”。例如:数字档案馆是指以二进制编码的数字方式存储、处理档案信息内容,应用计算机、通讯和多媒体技术,提供电子网络检索和服务的档案信息系统。数字档案馆是政府信息资源的数据中心和数据交换站,它是建立在现代信息技术的普遍应用基础上,利用数字手段,以高度有序的综合档案信息资源为处理核心,以高速宽带通信网络为技术设施的超大规模、分布式数字信息系统,属于国家数字化信息基础工程[2]。定义强调数字档案馆是一个信息系统,但是,没有给出信息系统的确切内涵。即没有具体阐明信息系统是指生成、发送、接收、储存、处理、交换与发布数字档案和电子文件的人与机构,档案信息计算机管理软件系统,还是兼而有之或其他。

2、信息仓储论

信息仓储论也常见诸报端。持这一观点者通常将数字档案馆定义为“信息仓库”、“知识信息中心”、“数据中心和数据交换站”等。例如:数字档案馆是一个电子化信息的仓储,能够存储大量各种形式的信息,用户可以通过网络方便地访问它,以获取这些信息,并且其信息存储和用户访问不受地域限制。它能把包括多媒体在内的各种信息的数字化、存储管理、查询和发布集成在一起,使这些信息得以在网络上传播,从而最大限度地利用这些信息[3]。所谓“数字档案馆”,就是将传统的以纸张、磁带、录像带等为存储介质的各种原始档案资料,通过扫描、压缩、转化等手段转换成PDF格式的文件,通过文字识别等技术得到对应于每张图片的索引字段,再运用分级存储管理技术将PDF文件和索引字段存储于光盘库、磁带库等各种大容量的存储介质上,并可通过各种方便的查询手段迅速地检索出所需要的档案资料,同时以上形成的数字化档案资料可以发布到局域网、广域网,最终实现“数字档案馆”[4]。定义强调了数字档案馆的信息存储和传播功能,但对数字档案馆本质属性的描述存在着一定的局限性。

3、信息环境论

信息环境论将数字档案馆看作是一种“信息组织模式”,一种以文件和档案信息为特定对象的有序的“信息空间”和开放的“信息环境”。例如:数字档案馆是采用现代高新技术所支持的数字档案信息系统,是档案信息组织模式,代表的是一种信息环境和基础设施构建,是超大规模的、便于使用的、没有时空限制的知识信息中心[5]。定义对数字档案馆本质属性的表述显得比较宏观与抽象,环境的内涵究竟是什么,难以具体认知。

4、功能拓展论

功能拓展论将数字档案馆定义为传统档案馆利用现代技术拓展服务功能的一种方式。例如:数字档案馆是传统档案馆功能的扩大,它以统一的标准和规范为基础,将有价值的馆藏信息资源数字化和通过各种途径收集、捕获的有价值的电子文件信息,在加工处理后以数字化形式进行存贮,并以智能检索技术为手段,提供统一友好的检索界面,利用先进的信息处理技术和互联的计算机网络,向用户提供多媒体数字信息服务[6]。定义描述的是数字档案馆与传统档案馆的内在联系,也没有确切地揭示数字档案馆的本质属性。

其它还有一些类似的释义,不再一一列举。从以上几种定义来看,多为描述性定义,差异较大,各具特色,反映了不同研究者从不同的视角所得到的数字档案馆概念。

那么,怎样才能从当代信息科学与档案学的角度来对数字档案馆这一词语的含义进行认定和概括,使所有数字档案馆建设者都能够清晰地勾勒出未来的目标呢?笔者认为,只有对数字档案馆这一信息时代“新生儿”的本质属性与内涵有一个全面的了解与认识,才能得出相对比较完整和清晰的数字档案馆定义。

(二)数字档案馆的定义及其内涵

综上所述,我们是否可以这样来定义:数字档案馆是在分布式计算机网络环境中,利用数据库技术、数字技术、多媒体技术和计算机网络技术创建、获取、存储、处理、交换与发布数字档案信息的档案信息管理与服务机构,是各级政府和各单位信息化建设的有机组成部分。这一定义包括了三个方面的涵义:

1、揭示了数字档案馆的本质属性是数字档案信息的管理与服务机构,即生成、发送、接收、储存、处理、交换与发布数字档案和电子文件的人与机构。

以往,档案界关于数字档案馆的定义一般分为“虚”、“实”两种类型。所谓“虚”即把数字档案馆定义为一种技术模式,一个数字化的信息系统,一种以文件和档案信息为特定对象的有序的信息空间和开放的信息环境。所谓“实”则是将数字档案馆定义为一种实体概念、机构概念,一种新的档案馆形态概念。笔者比较赞同后一种观点。原因在于(1)前者所说的技术模式和信息系统都离不开生成、发送、接收、储存、处理、交换与发布数字档案和电子文件的人与机构这一基本点。数字档案馆与人和机构的职能密不可分,在人和机构的管理下有效运行。计算机软件系统只是由人和机构控制的数字档案馆的运作工具,而不是数字档案馆或者说信息系统的全部。(2)本定义所指的数字档案信息管理与服务机构并不一定局限于传统档案馆的范畴。既可以是复合档案馆(传统档案馆+数字档案馆)的组成部分,也可以是机关、团体、企事业单位的数字档案管理部门或其他新型的数字档案信息管理与服务机构。例如,如商业化的档案数据库开发商等。数字档案馆,尤其是广义数字档案馆的运行,将更依赖这些机构之间的协同工作。

2、明确了数字档案馆在国家信息化建设中的重要地位,即数字档案馆是各级政府和各单位信息化建设的有机组成部分。

数字档案馆建设的最终目标是要通过国家信息基础工程把各级各类档案馆组织在一起,把档案信息与其他门类信息综合起来,作为国家信息资源的组成部分,面向全社会发挥作用[7]。所以,数字档案馆建设项目、尤其是国家综合档案馆的数字档案馆建设项目应该从一开始就纳入到国家信息基础工程之中统一规划与设计。数字档案馆不仅仅指某个档案馆的计算机业务管理系统,也不是简单地通过计算机网络连接在一起的档案馆群体,更不是封闭的档案馆信息网络,而是办公自动化系统、计算机辅助设计系统、业务信息管理系统以及公共信息管理系统等信息系统的重要组成部分。数字档案馆的核心资源主要来自相关的信息系统,同时又可与相关信息系统进行信息共享。

3、确定了数字档案馆的主要任务是在分布式计算机网络环境中,利用数据库技术、数字技术、多媒体技术和计算机网络技术创建、获取、存储、处理、交换与发布数字档案信息。

数字档案馆的主要任务可分为两大部分:即数字档案资源建设与信息服务。其中,资源建设主要包括创建、获取、存储、处理数字档案信息四个环节;信息服务包括交换与发布数字档案信息二个环节。从表面看,数字档案馆的任务与传统档案馆有着许多异曲同工之处,但仔细分析一下,两者的内涵存在着很大的差异。(1)管理对象不同。数字档案馆的管理对象是数字档案,这是一种新型的档案,其存储方式和管理要求与传统档案有着很大的差别。(2)资源建设的途径与方式不同。数字档案资源来源之一是相关的信息系统中具有保存价值的电子文件和数据,来源之二是被数字化的档案馆藏,来源之三是通过搜索引擎获得的具有档案性质的网络信息与资料,来源之四是购买商业公司开发的专题档案数据库,来源之五是其他可共享的数字档案馆资源。这与传统档案馆根据国家规定,通过接收、征集相关部门档案来组织各自特定馆藏的资源建设模式有着很大的区别。(3)信息服务的方式与范围不同。数字档案馆借助数据库技术、数字技术、多媒体技术和计算机网络技术开展档案信息的网上采集与服务,不受地域、时间、档案实体物理位置的限制,可以全方位、零距离地接收档案和为用户提供信息服务,大大拓展了传统档案馆的收集与服务功能。

此外,基于职能范围与组织形式的不同,数字档案馆还有广义与狭义之分。广义数字档案馆是指基于网络环境、采用面向对象分布式网状结构管理模式、由众多档案资源库和档案信息资源管理与服务机构组成的数字档案馆群体。而狭义数字档案馆则是指拥有特定的档案资源库及专业管理人员,借助现代技术履行和拓展传统档案馆的档案信息管理与服务功能,为广义数字档案馆提供数字档案信息资源和技术支持的档案信息资源管理与服务机构个体。两者相辅相成,密不可分。广义数字档案馆是数字档案馆建设的最高境界,而狭义数字档案馆则是广义数字档案馆的基石与重要组成部分。

二、数字档案馆理论体系建设

数字档案馆的理论研究涉及多个学科领域。例如,档案学、信息学、计算机科学、管理学等。不同学科领域的研究者携手开展数字档案馆理论研究,势必会更加有力地推进数字档案馆理论体系的建设。但是,对于数字档案馆这一档案工作创新变革的产物,档案界似应更多地承担起建设相关理论体系的重任。鉴于档案学科是一门实践性很强的学科,本文试图从档案学理论研究与档案工作实践相结合的角度,对数字档案馆理论体系建设的内容作一些初步的探讨。

(一)数字档案馆基础理论建设

数字档案馆基础理论研究离不开传统档案学科基础理论研究的基础,是对传统档案学基础理论研究的深化与拓展。这部分内容主要包括:(1)数字档案的定义及边界。例如:数字档案馆的管理对象究竟是什么?与图书馆、博物馆和其他信息管理机构的管理对象有什么区别与联系?大档案的概念外延到底有多大?这对于当前档案部门科学构建数字档案馆信息资源库,合理配置有限的人财物资源具有重要的指导意义。(2)数字档案馆的管理体制与机制。例如,在数字化、网络化的环境下,如何理解和贯彻档案工作“统一领导、分级管理”的组织原则,建立起科学的数字档案馆体系,推进数字档案资源的共建与共享?如何构建数字档案馆的绩效评估机制等。(3)狭义数字档案馆的组织架构、工作环节以及相关的工作原则与要求。例如,数字档案信息的创建、获取、鉴定、存储、处理、交换、发布、利用、保密等应采取哪些策略,建立哪些制度?在数字化的环境下,如何根据数字档案的形成目的、形成活动、形成过程、处理程序和职能范围来正确运用档案管理的基本原则----来源原则等。

上述理论问题,在目前的档案学理论研究专著及教材中所占的比重相对偏少。一般只是在涉及电子文件管理的相关章节中作一些概要的介绍。与数字档案馆建设实践的推进速度相比较,档案界关于数字档案馆基础理论的研究还显得比较欠缺和薄弱。然而,在当前社会信息化快速发展的大背景下,档案学科领域基础理论研究的或缺,势必会导致实践的盲目性和无所适从,进而加速档案工作的边缘化趋势。笔者认为,档案工作者需要学习、了解和掌握现代信息技术,更需要明白自己的历史使命与工作内涵。数字档案馆既不能成为信息孤岛,也不是一个没有独特内涵、漫无边际的信息大仓库。需求不明晰往往是导致一些数字档案馆建设项目难以达到预期效果的一个重要原因。

(二)与数字档案馆建设有关的法律规章建设。

这方面的内容有很多,这里只能列举一些实践中遇到的、亟需解决的法律规章问题。(1)档案工作的法律规章。例如,关于各级各类数字档案馆获取数字档案资源合法性的确认程序与方法;实施双套制归档的电子文件范围的确定与监控措施等问题。(2)政府信息公开的法律规章。例如,由档案馆负责发布、用于政府信息公开的电子文件与各机关档案室移交进馆的电子文件之间的关系问题,政府信息公开电子文件归属与处置权问题等。(3)著作权、知识产权保护的法规政策。例如,数字档案的处置权和公布权确认程序与方法等。(4)保护公民隐私权、知情权的法规政策。例如,在数字档案信息的发布与利用过程中,如何正确处理保障公民隐私权与知情权的关系,积极推进信用档案以及其他社会公共信息资源的社会利用问题。(5)信息共建共享的法规政策。例如,如何建立信息共建共享的保障机制,在数字档案资源整合的过程中明确有关各方的责任与义务、确保有关各方的权益和利益的问题。

数字档案馆建设的主要宗旨之一就是要充分开发利用档案信息,为国家、社会和公民提供高效、便捷的服务,推进政府信息公开、构建社会主义和谐社会。但是,对于目前档案信息开发利用中涉及到的许多法律问题,现有的法律规章中没有明确的规定。例如,《中华人民共和国档案法》规定:档案一般应自形成之日起满30年向社会开放。那么档案馆馆藏档案中的大量属于信息公开范围的文件,是否可以先行纳入数字化范围,通过网络向社会发布?发布的依据是什么?这里就涉及到《档案法》与政府信息公开规定之间相互衔接的问题。综上所述,档案界应注意总结和发现数字档案馆建设实践中遇到的法律问题,积极推进相关法律规章的修订与完善,确保数字档案馆建设有法可依,为数字档案馆建设提供有力的法律保障。

(三)数字档案馆的标准体系建设

在信息化建设快速发展的今天,标准体系建设已经越来越受到档案界的重视与关注。涉及数字档案馆建设的标准主要可以分为三个层面:(1)管理标准。管理标准是数字档案馆规划、设计、建设、验收、测评、运行与维护的依据,主要由软硬件工程标准、系统安全管理及等级保护标准、验收与监理标准、测试与评估标准、质量控制与认证标准等组成,可用于对数字档案馆建设项目进行风险管理与质量控制。(2)业务标准。业务标准是数字档案馆资源建设与信息服务工作的规范。主要内容有:①基础标准体系(包括基本术语、业务过程建模、业务过程规范的描述语言和业务过程规范标准等),是数字档案馆总体设计的依据。②信息资源标准体系(包括信息收集范围及保管期限,数据结构、信息分类编码、数据交换、文本和办公系统、置标语言、目录体系和Web服务、中文汉字编码和汉字编码字符集标准等),是信息资源能够互联互通和有效应用的基础保障。(3)技术标准。技术标准是数字档案馆建设过程中最基本的要素。主要内容有:①技术基础标准体系(包括信息技术术语、中文平台、多媒体与图形图像、存储媒体、数据库、地理信息、软件和设备标准等)。②网络通信标准体系(包括网络体系结构、网络管理、电缆光缆、综合布线和配套设施标准等)。③信息安全标准体系(包括密码技术、安全协议、标识与鉴别、访问控制、电子签名、完整性保护、抗抵赖、审计与监控、公钥基础设施、物理安全技术标准等)。

标准体系是数字档案馆资源整合与共享的重要基础,是有效形成和促进数字档案馆与相关信息系统业务协同的必不可少的条件。鉴于一个科学、高效的数字档案馆体系需要按照社会信息化整体环境的要求来组织,上述数字档案馆标准体系的建设应尽可能注意与国际接轨,并尽可能借鉴使用相关信息管理领域已经采用的比较成熟的标准,以保障信息交换的畅通。就目前国内的研究情况来看,主要的问题还是缺乏数字档案馆的顶层设计。虽然近年来,在国家档案局的领导与组织下,理论工作者和实际工作者正在合作开展相关标准的研究,并已形成一批与数字档案馆业务建设有关的标准规范。但是,从总体上来说,标准体系的研究还是相对比较滞后。这一现象已经成为制约数字档案馆建设发展的一个主要因素。改变这一状况的办法主要有:(1)学习借鉴相关的国际、国内已有的技术标准。要组织力量对已有的标准进行翻译、梳理,形成体系,为数字档案馆建设项目提供切实可行的标准与依据。(2)继续组织理论工作者和实际工作者携手进行管理标准和业务标准的研究与制订。要重点关注对数字档案馆建设实践具有重要指导意义、目前暂无国际标准、国家标准和行业标准可借鉴的标准。例如:系统安全管理及等级保护标准,验收与监理标准,测试与评估标准,质量控制与认证标准,业务过程规范标准,信息收集范围及保管期限、数据结构、信息分类编码、数据交换等方面的标准。逐步从管理、业务和技术三个层面上形成较为完整的数字档案馆标准体系,为方兴未艾的数字档案馆建设实践提供科学指导。

参考文献

1、刘东敏、莫荣海:“关于数字档案馆的思考”,《海南档案》,2002(2)

2、曾军:“论怎样建设数字档案馆”,

http://www.gygov.gov.cn/danganju/myweb/xueshu_05.htm/2003-06-30

3、傅荣校:“认识数字档案馆----兼论数字档案馆与虚拟档案馆的区别”,《中国档案》,2001(5)

4、数字方舟数字档案馆解决方案,

http://www.soft6.com/solution/220/2003-11-23

5、数字档案馆的建设意义,

http://da.yctc.edu.cn/newshtml/ltzx/20030519150452.htm/2003-05-19

6、潘连根:“数字档案馆的定义及特征----数字档案馆研究之二”,《浙江档案》,2004(4)

7、杨公之:《档案信息化建设导论》,北京:中国档案出版社,2001

8、冯惠玲、张辑哲:《档案学概论》,北京:中国人民大学出版社,2001

9、房庆:“掌握信息化标准,推动信息化建设”,

(作者: )