江苏省文书档案文件级目录数据库结构与数据交换格式

发布者:钱杰生发布时间:2014-12-23浏览次数:3558

  1 范围

  本标准规定了文书档案文件级目录数据库结构与数据交换格式的定义、数据库结构与交换格式、使用方法。

  本标准适用于文件级文书档案目录数据库结构与其目录数据的交换、档案管理软件开发中数据库结构的设计与数据交换。

  2 规范性引用文件

  下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

  GB/T 7408-94数据元和交换格式信息交换日期和时间表示法

  GB 7156-87 文献保密等级代码

  GB 11714-1997全国组织机构代码编制规则

  DA/T 1-2000档案工作基本术语

  DA/T 18-1999档案著录规则

  DA/T 22-2000归档文件整理规则

  《中国档案分类法》

  《档案分类标引规则》

  《中国档案主题词表》

  《文献主题标引规则》

  3 术语和定义

  下列术语和定义适用于本标准。

  3.1 档案 archives

  国家机构、社会组织或个人在社会活动中直接形成的有价值的历史记录[DA/T 1-2000中2.1]

  3.2 文书档案 administrative archives

  反映党务、行政管理等活动的档案[DA/T 1-20002.8]

  3.3 著录 description

  在编制档案目录时,对档案的内容和形式特征等进行分析、选择和记录的过程[DA/T 18-19993.1]

  3.4 著录项目 items of description

  揭示档案内容和形式特征的记录事项[DA/T 18-19993.2]。包括分类号项、档案馆代号项、组织机构代码项、档号项、电子文档号项、缩微号项、题名项、文件编号项、责任者项、稿本项、文种项、密级项、保管期限项、时间项、载体规格项、载体类型项、载体数量项、载体单位项、全文标识项、主题词或关键词项、主办部门项、协办部门项、附注项。

  3.5 条目 entry

  反映文件或案卷内容形式特征的著录项目的组合[DA/ T 1-2000中6.4]

  3.6 电子文件 electronic records

  以数码形式记录于磁带、磁盘、光盘等载体、依赖计算机系统阅读、处理并可在通讯网络上传输的文件[DA/T 1-20002.13]

  3.7 著录格式 format of description

  著录项目在条目中的排列顺序及其表达方式[DA/T 1819993.4]

  3.8 数据记录 data record

  描述著录条目的数据集合,由若干数据字段组成。

  3.9 数据字段 data field

  描述著录条目中某一特定属性的数据集合。

  3.9.1 分类号 classified code

  揭示档案主题内容和档案信息分类体系中的类目代码。

  3.9.2 档案馆代号 code of archives

  档案馆代号依据《编制全国档案馆名称代码实施细则》所赋予的代码著录。

  3.9.3 组织机构代码 code of organization

  根据 GB 11714-1997《全国组织机构代码编制规则》所赋予的一组织代码。

  3.9.4 档号 archival code

  以字符形式赋予档案[DA/T 1-2000中2.1]实体的用以固定和反映档案[DA/T 1-20002.1]排列顺序的一组代码。

  3.9.5 电子文档号 code of electronic records

  是档案馆、室管理电子文件的一组符号代码。

  3.9.6 缩微号 code of microfilm

  档案馆、室赋予档案缩微制品的编号。

  3.9.7 题名 title

  题名,又称标题、题目,是表达档案中心内容、形式特征的名称。

  3.9.8 文件编号或文号 record number

  文件制发过程中由制发机关、团体或个人赋予文件的顺序号。文件编号包括发文字号、科研试验报告流水号、标准规范类文件的统编号、图号等。

  3.9.9 责任者 author

  责任者,也称作者,是指形成档案内容并对其负有责任的团体或个人。

  3.9.10 稿本 manuscript

  稿本是指档案文件的文稿、文本和版本。

  3.9.11 文种 record type

  按性质和用途确定的文种种类的名称。

  3.9.12 密级 security classification

  文件保密程度的等级。

  3.9.13 保管期限 retention period

  对档案划定的存留年限。

  3.9.14 时间或成文日期 data of record created

  文件形成时间。一般公私文书、信札为发文时间,决议、决定、命令、法令、规程、规范、标准、条例等法规性文件为通过或发布时间,条约、合同、协议为签署时间,技术评审证书、技术鉴定证书、转产证书为通过时间,获奖证书、发明证书、专利证书为颁发时间,科研试验报告、学术论文为发表时间,工程施工图、产品加工图为设计时间,竣工图为绘制时间,原始试验记录、测定检验数据为记录时间等。

  3.9.15 载体类型 type of media items

  档案信息载体物质形态的种类。

  3.9.16 载体数量 quantity of media items

  档案信息载体物质形态的数量。

  3.9.17 载体单位 unit of media items

  档案信息载体物质形态的统计单位。

  3.9.18 载体规格 specification of media items

  档案信息载体物质形态的尺寸及型号。

  3.9.19 主题词或关键词 descriptor

  主题词是指在标引和检索中用以表达文献主题的规范化的词或词组。

  关键词是指在标引和检索中取自文件、案卷题名或正文用以表达文献主题并具有检索意义的非规范化的词或词组。

  3.9.20 全文标识 sign of whole article

  标识机读档案全文位置的一组字符串。

  3.9.21 主办部门 department of sponsor

  主办部门是文件在文书处理时的主要办理的部门名称。

  3.9.22 协办部门 cooperative department

  协办部门是文件在文书处理时的协助主办部门办理文件的部门名称。

  3.9.23 附注或备注 remark

  附注指对归档文件内容的补充解释与说明。

  4 数据库结构和交换格式

  4.1 文件级目录数据库结构 见表1。

  4.1.1 文书档案目录数据库表的定义,应按照表1所给出的字段名称及其它属性进行。如果使用的数据库管理系统(DBMS)不支持Var CharInt类型,可以用相应长度的字符型、数值型代替。

  4.1.2 应使用组织机构代码(ZZJGDM)和档号(DH)字段作为文书档案目录数据库表的主键。

  4.2 数据交换格式

  表1 文件级目录数据库结构

顺序号

著 录 项 目

著录项目在计算机中的表示

字段名

字段长度(字节)

允许空

NULL)

  1

  分类号

FLH

Char

30

  2

  档案馆代号

DAGDH

Char

6

  3

  组织机构代码

ZZJGDM

Char

9

  4

  档号

DH

Char

19

  5

  电子文档号

DZWDH

Char

12

  6

  缩微号

SWH

Char

9

  7

  题名

TM

Var Char

120

  8

  文件编号或文号

WH

Char

30

  9

  责任者

ZRZ

Var Char

60

  10

  稿本

GB

Char

10

  11

  文种

WZ

Char

8

  12

  密级

MJ

Char

1

  统一使用数字代码

  13

  保管期限

BGQX

Char

1

  14

  时间或成文日期

CWRQ

Char

8

  要求合法日期值

  15

  载体规格

ZTGG

Char

12

  16

  载体类型

ZTLX

Char

12

  17

  载体数量

ZTSL

Int

4

  18

  载体单位

ZTDW

  Char

2

19

  主题词或关键词

ZTC

Var Char

100

20

  全文标识

QWBS

Var Char

255

用于访问全文

21

  主办部门

ZBBM

Var Char

60

多用户环境下用于控制数据访问权限

22

  协办部门

XBBM

Var Char

255

23

  附注或备注

BZ

Var Char

120

  注:1、Char为定长字符型,Var Char为可变长字符型,Int为整型

2、对不允许空值的著录项目,若确实无法确定输入何值时,可取“不详”等类似内容代之。

  4.2.1 数据交换(跨平台、跨系统)通过计算机文件实现。用以交换的计算机文件是DBF或TXT格式。

  4.2.2使用DBF格式文件交换的,其数据库表的结构(字段名、字段顺序及字段的其它待征)应与表1相一致。

  示例

  FLH

     DAGDH

     ZZJGDM466000424

     DH 0304199900300000034

     DZWDH

  SWH

     TM 关于对《归档文件整理规则》进一步征求意见的通知

     WH 苏档[1999]0106号

     ZRZ 江苏省档案局

  GB

     WZ 通知

     MJ 1

  BGQX 3

     CWRQ 19991104

     ZTGG

     ZTLX

     ZTSL 12

  ZTDW

     ZTC 档案 标准 征求意见 通知

  QWBS

     ZBBM 馆室处

     XBBM

     BZ

  4.2.3使用TXT格式文件交换的,每条记录占一行,每个字段占一列。各列数据的排列顺序须与表1相一致,且列与列之间用TAB分隔符分隔。

  4.2.4经过加密处理的数据交换文件,移交的同时应提供相应的解密手段。

  4.2.5经过压缩、分割处理的数据交换文件,移交的同时应提供相应的解压缩、合并手段。

  4.2.6数据由计算机档案管理软件产生的,若该管理软件使用的数据库不是DBF数据库,须提供从该数据库导出成符合4.2.24.2.3要求的DBFTXT格式文件和由DBFTXT格式文件导入进该数据库的应用程序接口。

  5 使用方法

  5.1 分类号

  依据《中国档案分类法》和《档案分类标引规则》的有关规定著录。

  5.2 档案馆代号

  用规定的数字表示。

  5.3 组织机构代码

  用规定的字符表示。由八位数字(或大写拉丁字母)本体代码和一位数字(或大写拉丁字母)校验码组成。代码的表示形式为:

  XXXXXXXXX

  校验码

  连字符(机读时省略)

  本体代码

  5.4 档号

  由全宗号、年度、保管期限代号(或目录号)、机构(问题)代号(或案卷号)、件号(或页号)五部分组成。其格式为:“全宗号-年度-保管期限代号-机构(问题)代号-件号”,即“XXXX-XXXX-XXX-XXXX-XXXX”。对已经装订成卷的档案,应该采用:“全宗号-年度-目录号-案卷号-页号”格式。

  全宗号是档案馆给各立档单位的一组字符代码。

  年度指归档文件形成的公元纪年。

  保管期限代号是文件保管期限的数字代码;若立卷,表示目录号。

  机构(问题)代号根据《归档文件整理规则》5.2进行设置,是文件归档最低一级的分类代号;若立卷,表示案卷号。企业、事业单位的文书档案的分类,可在此四位范围内自行定义。

  件号是在归档文件分类方案的最低一级类目内,文件的排列顺序号;若立卷,应该著录页号。

  全宗号、年度、保管期限代号、机构(问题)代号、件号按实际位数著录,不够规定长度时,前面用“0”填充。

  例1 “0304199900300000034”,全宗号是304,年度是1999,保管期限代号是3,机构(问题)代号是0000,件号是34

  例2 “0204000000103230007”,全宗号是204,目录号是1,案卷号323,页号是7

  5.5 电子文档号

  用规定的字母和数字表示。

  5.6 缩微号

  由盘号和画幅号组成。其格式为:盘号-画幅号,即XXXXX-XXXX

  盘号、画幅号位数不足的,用“0”填充。

  5.7 题名

  用汉字等表示。

  5.8 文件编号或文号

  一般由机关代字、年度和顺序号三部分组成。其格式为“机关代字[年度]顺序号”,其中“[”和“]”是半角字符。

  顺序号由四位数字表示,不足规定长度的,前面用“0”填充。

例如,“苏档[2001]0014号”,是江苏省档案局2001年发的第14号文。

  5.9 责任者

  用汉字表示。责任者有多个时,著录列居首位责任者,立档单位本身是责任者的必须著录,其余视需要著录。被省略的责任者用[等]表示。各责任者之间用分号分隔。

  如果作者没有,输入“不详”。

  5.10 稿本

  用汉字表示。稿本项依实际情况著录为草稿、定稿、手稿、草图、原图、底图、蓝图、正本、副本、原版、试行本、修订本、影印本等。

  5.11 文种

  用汉字表示。文种项依实际情况著录。如命令、决议、指示、通知、报告、批复、函、会议纪要、说明书、协议书、鉴定书、任务书、判决书、国书、照会、诰、敕、奏折等。

  5.12 密级

  用数字表示。按GB 7156-87文献保密等级代码规定(见表2)。“密级” 在计算机内以“数字代码”存储,而给用户的提示应使用“汉字代码”。文件无密级时不著录。

2 文献保密等级代码

  数字代码

  汉语拼音代码

  汉字代码

  名

  0

1

2

3

4

5

GK

GN

NB

MM

JM

UM

公开

国内

内部

秘密

机密

绝密

  公开级

  国内级

  内部级

  秘密级

  机密级

  绝密级

  5.13 保管期限

  用数字表示。若“保管期限”分别用永久、长期、短期表示,则对应的数字代码分别为1、23。若“保管期限”用其它方法划分时,除保留原永久、长期、短期使用的数字代码123外,应使用数字3之后的数字依次代表。

  本字段在计算机内以“数字代码”存储,而给用户的提示应使用“汉字代码”。

  5.14 时间或成文日期

  时间项依据GB/T 7408-94中5.2规定,其基本格式为CCYYMMDD,并一律用8位阿拉伯数字表示,其中[CCYY]表示一个日历年,[MM]表示日历年内日历月的顺序数,[DD]表示日历月中日历日的顺序数(GB/T 7408-945.2)。时间不详时用数字“0”表示。

  例1:19980000,即:表示年度为1998年,月、日不详。

  例2:00000728,即:表示年度不详,月、日为728日。

  对时间项的著录,不允许出现无效的日期值。例如:19980229、19991301200011312001928

等,均为无效日期。

  5.15 载体规格

  据实著录。如:16开、A4105mm148mm3.5英寸等。

  5.16 载体类型

  用汉字表示。按甲骨、金石、简牍、缣帛、纸、唱片、照片、胶片、胶卷、磁带、磁盘、光盘等。以纸张为载体的档案可以不予著录,其它载体类型据实著录。

  5.17 载体数量

  用阿拉伯数字表示。

  5.18 载体单位

  用汉字表示。如“页”、“张”、“卷”、“册”、“盒”、“盘”、“片”、“米”等。

  5.19 主题词或关键词

  主题词参照《中国档案主题词表》、《文献主题标引规则》及本专业、本单位的规范化词表进行标

引,各词之间用空格隔开。

  5.20 全文标识

  全文标识包括全文文件的路径、名称和类型三个部分。

  例“G:\Documents and Setting\Administrator\桌面\江苏省档案目录数据库结构及数据交换格式.doc”。其中,“G:\Documents and Setting\Administrator\桌面\”为路径,“江苏省档案目录数据库结构及数据交换格式”为文件名,“.doc”为类型。

  5.21 主办部门

  用汉字表示。

  5.22 协办部门

  用汉字表示。有多个协办机构时,协办机构之间用逗号分隔。

  5.23 附注或备注

  用汉字表示。