1 范围
本标准规定了文书档案文件级目录数据库结构与数据交换格式的定义、数据库结构与交换格式、使用方法。
本标准适用于文件级文书档案目录数据库结构与其目录数据的交换、档案管理软件开发中数据库结构的设计与数据交换。
2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 7408-94数据元和交换格式信息交换日期和时间表示法
GB 7156-87 文献保密等级代码
GB 11714-1997全国组织机构代码编制规则
DA/T 1-2000档案工作基本术语
DA/T 18-1999档案著录规则
DA/T 22-2000归档文件整理规则
《中国档案分类法》
《档案分类标引规则》
《中国档案主题词表》
《文献主题标引规则》
3 术语和定义
下列术语和定义适用于本标准。
3.1 档案 archives
国家机构、社会组织或个人在社会活动中直接形成的有价值的历史记录[DA/T 1-2000中2.1]。
3.2 文书档案 administrative archives
反映党务、行政管理等活动的档案[DA/T 1-2000中2.8]。
3.3 著录 description
在编制档案目录时,对档案的内容和形式特征等进行分析、选择和记录的过程[DA/T 18-1999中3.1]。
3.4 著录项目 items of description
揭示档案内容和形式特征的记录事项[DA/T 18-1999中3.2]。包括分类号项、档案馆代号项、组织机构代码项、档号项、电子文档号项、缩微号项、题名项、文件编号项、责任者项、稿本项、文种项、密级项、保管期限项、时间项、载体规格项、载体类型项、载体数量项、载体单位项、全文标识项、主题词或关键词项、主办部门项、协办部门项、附注项。
3.5 条目 entry
反映文件或案卷内容形式特征的著录项目的组合[DA/ T 1-2000中6.4]。
3.6 电子文件 electronic records
以数码形式记录于磁带、磁盘、光盘等载体、依赖计算机系统阅读、处理并可在通讯网络上传输的文件[DA/T 1-2000中2.13]。
3.7 著录格式 format of description
著录项目在条目中的排列顺序及其表达方式[DA/T 18—1999中3.4]。
3.8 数据记录 data record
描述著录条目的数据集合,由若干数据字段组成。
3.9 数据字段 data field
描述著录条目中某一特定属性的数据集合。
3.9.1 分类号 classified code
揭示档案主题内容和档案信息分类体系中的类目代码。
3.9.2 档案馆代号 code of archives
档案馆代号依据《编制全国档案馆名称代码实施细则》所赋予的代码著录。
3.9.3 组织机构代码 code of organization
根据 GB 11714-1997《全国组织机构代码编制规则》所赋予的一组织代码。
3.9.4 档号 archival code
以字符形式赋予档案[DA/T 1-2000中2.1]实体的用以固定和反映档案[DA/T 1-2000中2.1]排列顺序的一组代码。
3.9.5 电子文档号 code of electronic records
是档案馆、室管理电子文件的一组符号代码。
3.9.6 缩微号 code of microfilm
档案馆、室赋予档案缩微制品的编号。
3.9.7 题名 title
题名,又称标题、题目,是表达档案中心内容、形式特征的名称。
3.9.8 文件编号或文号 record number
文件制发过程中由制发机关、团体或个人赋予文件的顺序号。文件编号包括发文字号、科研试验报告流水号、标准规范类文件的统编号、图号等。
3.9.9 责任者 author
责任者,也称作者,是指形成档案内容并对其负有责任的团体或个人。
3.9.10 稿本 manuscript
稿本是指档案文件的文稿、文本和版本。
3.9.11 文种 record type
按性质和用途确定的文种种类的名称。
3.9.12 密级 security classification
文件保密程度的等级。
3.9.13 保管期限 retention period
对档案划定的存留年限。
3.9.14 时间或成文日期 data of record created
文件形成时间。一般公私文书、信札为发文时间,决议、决定、命令、法令、规程、规范、标准、条例等法规性文件为通过或发布时间,条约、合同、协议为签署时间,技术评审证书、技术鉴定证书、转产证书为通过时间,获奖证书、发明证书、专利证书为颁发时间,科研试验报告、学术论文为发表时间,工程施工图、产品加工图为设计时间,竣工图为绘制时间,原始试验记录、测定检验数据为记录时间等。
3.9.15 载体类型 type of media items
档案信息载体物质形态的种类。
3.9.16 载体数量 quantity of media items
档案信息载体物质形态的数量。
3.9.17 载体单位 unit of media items
档案信息载体物质形态的统计单位。
3.9.18 载体规格 specification of media items
档案信息载体物质形态的尺寸及型号。
3.9.19 主题词或关键词 descriptor
主题词是指在标引和检索中用以表达文献主题的规范化的词或词组。
关键词是指在标引和检索中取自文件、案卷题名或正文用以表达文献主题并具有检索意义的非规范化的词或词组。
3.9.20 全文标识 sign of whole article
标识机读档案全文位置的一组字符串。
3.9.21 主办部门 department of sponsor
主办部门是文件在文书处理时的主要办理的部门名称。
3.9.22 协办部门 cooperative department
协办部门是文件在文书处理时的协助主办部门办理文件的部门名称。
3.9.23 附注或备注 remark
附注指对归档文件内容的补充解释与说明。
4 数据库结构和交换格式
4.1 文件级目录数据库结构 见表1。
4.1.1 文书档案目录数据库表的定义,应按照表1所给出的字段名称及其它属性进行。如果使用的数据库管理系统(DBMS)不支持Var Char、Int类型,可以用相应长度的字符型、数值型代替。
4.1.2 应使用组织机构代码(ZZJGDM)和档号(DH)字段作为文书档案目录数据库表的主键。
4.2 数据交换格式
表1 文件级目录数据库结构
顺序号 | 著 录 项 目 | 著录项目在计算机中的表示 |
字段名 | 类型 | 字段长度(字节) | 允许空 (NULL) | 说明 |
1 | 分类号 | FLH | Char | 30 | 是 | |
2 | 档案馆代号 | DAGDH | Char | 6 | 是 | |
3 | 组织机构代码 | ZZJGDM | Char | 9 | 否 | |
4 | 档号 | DH | Char | 19 | 否 | |
5 | 电子文档号 | DZWDH | Char | 12 | 是 | |
6 | 缩微号 | SWH | Char | 9 | 是 | |
7 | 题名 | TM | Var Char | 120 | 否 | |
8 | 文件编号或文号 | WH | Char | 30 | 是 | |
9 | 责任者 | ZRZ | Var Char | 60 | 否 | |
10 | 稿本 | GB | Char | 10 | 是 | |
11 | 文种 | WZ | Char | 8 | 是 | |
12 | 密级 | MJ | Char | 1 | 是 | 统一使用数字代码 |
13 | 保管期限 | BGQX | Char | 1 | 否 |
14 | 时间或成文日期 | CWRQ | Char | 8 | 是 | 要求合法日期值 |
15 | 载体规格 | ZTGG | Char | 12 | 是 | |
16 | 载体类型 | ZTLX | Char | 12 | 是 | |
17 | 载体数量 | ZTSL | Int | 4 | 是 | |
18 | 载体单位 | ZTDW | Char | 2 | 是 | |
19 | 主题词或关键词 | ZTC | Var Char | 100 | 是 | |
20 | 全文标识 | QWBS | Var Char | 255 | 是 | 用于访问全文 |
21 | 主办部门 | ZBBM | Var Char | 60 | 是 | 多用户环境下用于控制数据访问权限 |
22 | 协办部门 | XBBM | Var Char | 255 | 是 |
23 | 附注或备注 | BZ | Var Char | 120 | 是 | |
注:1、Char为定长字符型,Var Char为可变长字符型,Int为整型 2、对不允许空值的著录项目,若确实无法确定输入何值时,可取“不详”等类似内容代之。 |
4.2.1 数据交换(跨平台、跨系统)通过计算机文件实现。用以交换的计算机文件是DBF或TXT格式。
4.2.2使用DBF格式文件交换的,其数据库表的结构(字段名、字段顺序及字段的其它待征)应与表1相一致。
示例:
FLH
DAGDH
ZZJGDM466000424
DH 0304199900300000034
DZWDH
SWH
TM 关于对《归档文件整理规则》进一步征求意见的通知
WH 苏档[1999]0106号
ZRZ 江苏省档案局
GB
WZ 通知
MJ 1
BGQX 3
CWRQ 19991104
ZTGG
ZTLX
ZTSL 12
ZTDW 页
ZTC 档案 标准 征求意见 通知
QWBS
ZBBM 馆室处
XBBM
BZ
4.2.3使用TXT格式文件交换的,每条记录占一行,每个字段占一列。各列数据的排列顺序须与表1相一致,且列与列之间用TAB分隔符分隔。
4.2.4经过加密处理的数据交换文件,移交的同时应提供相应的解密手段。
4.2.5经过压缩、分割处理的数据交换文件,移交的同时应提供相应的解压缩、合并手段。
4.2.6数据由计算机档案管理软件产生的,若该管理软件使用的数据库不是DBF数据库,须提供从该数据库导出成符合4.2.2或4.2.3要求的DBF或TXT格式文件和由DBF或TXT格式文件导入进该数据库的应用程序接口。
5 使用方法
5.1 分类号
依据《中国档案分类法》和《档案分类标引规则》的有关规定著录。
5.2 档案馆代号
用规定的数字表示。
5.3 组织机构代码
用规定的字符表示。由八位数字(或大写拉丁字母)本体代码和一位数字(或大写拉丁字母)校验码组成。代码的表示形式为:
XXXXXXXX— X
校验码
连字符(机读时省略)
本体代码
5.4 档号
由全宗号、年度、保管期限代号(或目录号)、机构(问题)代号(或案卷号)、件号(或页号)五部分组成。其格式为:“全宗号-年度-保管期限代号-机构(问题)代号-件号”,即“XXXX-XXXX-XXX-XXXX-XXXX”。对已经装订成卷的档案,应该采用:“全宗号-年度-目录号-案卷号-页号”格式。
全宗号是档案馆给各立档单位的一组字符代码。
年度指归档文件形成的公元纪年。
保管期限代号是文件保管期限的数字代码;若立卷,表示目录号。
机构(问题)代号根据《归档文件整理规则》5.2进行设置,是文件归档最低一级的分类代号;若立卷,表示案卷号。企业、事业单位的文书档案的分类,可在此四位范围内自行定义。
件号是在归档文件分类方案的最低一级类目内,文件的排列顺序号;若立卷,应该著录页号。
全宗号、年度、保管期限代号、机构(问题)代号、件号按实际位数著录,不够规定长度时,前面用“0”填充。
例1 “0304199900300000034”,全宗号是304,年度是1999,保管期限代号是3,机构(问题)代号是0000,件号是34。
例2 “0204000000103230007”,全宗号是204,目录号是1,案卷号323,页号是7
5.5 电子文档号
用规定的字母和数字表示。
5.6 缩微号
由盘号和画幅号组成。其格式为:盘号-画幅号,即XXXXX-XXXX。
盘号、画幅号位数不足的,用“0”填充。
5.7 题名
用汉字等表示。
5.8 文件编号或文号
一般由机关代字、年度和顺序号三部分组成。其格式为“机关代字[年度]顺序号”,其中“[”和“]”是半角字符。
顺序号由四位数字表示,不足规定长度的,前面用“0”填充。
例如,“苏档[2001]0014号”,是江苏省档案局2001年发的第14号文。
5.9 责任者
用汉字表示。责任者有多个时,著录列居首位责任者,立档单位本身是责任者的必须著录,其余视需要著录。被省略的责任者用[等]表示。各责任者之间用分号分隔。
如果作者没有,输入“不详”。
5.10 稿本
用汉字表示。稿本项依实际情况著录为草稿、定稿、手稿、草图、原图、底图、蓝图、正本、副本、原版、试行本、修订本、影印本等。
5.11 文种
用汉字表示。文种项依实际情况著录。如命令、决议、指示、通知、报告、批复、函、会议纪要、说明书、协议书、鉴定书、任务书、判决书、国书、照会、诰、敕、奏折等。
5.12 密级
用数字表示。按GB 7156-87文献保密等级代码规定(见表2)。“密级” 在计算机内以“数字代码”存储,而给用户的提示应使用“汉字代码”。文件无密级时不著录。
表2 文献保密等级代码
数字代码 | 汉语拼音代码 | 汉字代码 | 名称 |
0 1 2 3 4 5 | GK GN NB MM JM UM | 公开 国内 内部 秘密 机密 绝密 | 公开级 国内级 内部级 秘密级 机密级 绝密级 |
5.13 保管期限
用数字表示。若“保管期限”分别用永久、长期、短期表示,则对应的数字代码分别为1、2、3。若“保管期限”用其它方法划分时,除保留原永久、长期、短期使用的数字代码1、2、3外,应使用数字3之后的数字依次代表。
本字段在计算机内以“数字代码”存储,而给用户的提示应使用“汉字代码”。
5.14 时间或成文日期
时间项依据GB/T 7408-94中5.2规定,其基本格式为CCYYMMDD,并一律用8位阿拉伯数字表示,其中[CCYY]表示一个日历年,[MM]表示日历年内日历月的顺序数,[DD]表示日历月中日历日的顺序数(GB/T 7408-94中5.2)。时间不详时用数字“0”表示。
例1:19980000,即:表示年度为1998年,月、日不详。
例2:00000728,即:表示年度不详,月、日为7月28日。
对时间项的著录,不允许出现无效的日期值。例如:19980229、19991301、20001131、2001928
等,均为无效日期。
5.15 载体规格
据实著录。如:16开、A4、105mm╳148mm、3.5英寸等。
5.16 载体类型
用汉字表示。按甲骨、金石、简牍、缣帛、纸、唱片、照片、胶片、胶卷、磁带、磁盘、光盘等。以纸张为载体的档案可以不予著录,其它载体类型据实著录。
5.17 载体数量
用阿拉伯数字表示。
5.18 载体单位
用汉字表示。如“页”、“张”、“卷”、“册”、“盒”、“盘”、“片”、“米”等。
5.19 主题词或关键词
主题词参照《中国档案主题词表》、《文献主题标引规则》及本专业、本单位的规范化词表进行标
引,各词之间用空格隔开。
5.20 全文标识
全文标识包括全文文件的路径、名称和类型三个部分。
例“G:\Documents and Setting\Administrator\桌面\江苏省档案目录数据库结构及数据交换格式.doc”。其中,“G:\Documents and Setting\Administrator\桌面\”为路径,“江苏省档案目录数据库结构及数据交换格式”为文件名,“.doc”为类型。
5.21 主办部门
用汉字表示。
5.22 协办部门
用汉字表示。有多个协办机构时,协办机构之间用逗号分隔。
5.23 附注或备注
用汉字表示。