对于农村社会经济统计信息分类与编码标准分析
杜伟 2011-06-16
论文摘要:依据农村社会经济统计信息的管理和应用实践,提出农村社会经济统计信息分类与编码的原则和方法,将统计信息对象按既定的原则进行分类编码,建立了规范的统计信息分类编码标准及统计信息基础数据库,制定了国家及省级《农村社会经济统计信息分类与编码》标准。
论文关键词:统计信息;分类编码;空间信息系统;信息基础数据库
信息分类编码是信息存储、处理、交换及共享的基础…。农村社会经济统计各种专题数据库应用系统虽已先后建成,但有关信息采集、处理与共享的技术标准的制定相对为滞后。对信息进行分类能够使信息系统条理清楚,易于管理,并能够方便地从中提取不同类型的信息加以分析利用。而采用信息分类编码是解决信息分类问题的有效方法。
自从开展信息分类编码标准化工作以来,一直没有适合自身业务特点的农村社会经济统计信息分类编码标准。因而迫切需要进行农村社会经济统计信息的分类与编码,以满足各有关方面对信息资源共享的需求。如何建立起一个可供统计各部门统一使用的国家产品分类编码标准体系,以实现信息管理的标准化,最终实现信息的共享,已成为统计信息标准化工作的一项十分紧迫的任务。农村社会经济统计信息分类编码标准化是统计信息标准化工作的一个专业领域,是统计信息化过程中的一项富有挑战性的基础工作。建立一个完善的农村社会经济统计信息分类编码体系,对农村社会经济统计基础数据库建设、信息共享和各类应用系统建立都至关重要。
1统计信息分类编码概念
分类编码是指把研究对象按各自的特征、特性进行分类,并按一定的规则编排成数字码或数字、字母混合码的过程。统计指标编码就是根据统计指标分类,将统计指标赋予一定规律性的易为计算机识别和处理的一组有序符号排列。农村社会经济统计信息分类编码就是用字符(数字、字母或符号)对不同的行政级别分属不同类别的统计指标进行分类,并按照不同的类别形成特定的规则和依据。
2统计信息分类编码原则
2.1分类原则我国已经开展了大量的农村社会经济统计工作,各类统计信息内容广泛,但是还没有形成一个统一的信息化的分类与编码,现有数据的检索、处理、分析和信息服务等存在困难,不能满足当前综合指标检索、分析、处理的要求,根据农村社会经济统计信息处理的实际需要,制定如下的分类原则:①分类的结构采用层级结构,逐级展开形成完整的分类体系;②分类要包括所有主要农村社会经济统计指标类型,适合各种检索、处理需要;③分类要保持统计指标体系的相对完整;④分类要处理好指标层次与指标分组的关系,加强分类的完备性。
2.2编码原则根据国标《标准编写规则》第3部分信息分类编码(GB/T20001.3-2001),结合农村社会经济信息的特性,将信息按如下原则分类与编码。①科学性、系统性。以适合现代计算机、数据库以及应用和管理为目标,按照农村社会经济信息的属性或特征进行科学分类,形成系统的分类体系。②稳定性。分类体系以各要素最稳定的属性或特征为基础,能在较长的时间内不发生重大变化。③完整性和可扩展性。分类既要反映要素的属性,又要反映要素间的相互关系,应具有完整性。农村社会经济统计信息的分类编码工作是一项较为复杂的系统工程,要包含所有主要的农村社会经济统计指标。④规范性。分类名称尽量沿用习惯名称,有国标则遵循国标,避免概念混淆。⑤唯一性。保证1个编码对象仅赋予1个代码,1个代码只反映1个编码对象。
3农村社会经济统计信息分类与编码方法
3.1分类方法信息分类的基本方法有线分类法、面分类法、混合分类法3种。基于统计信息的特性,农村社会经济统计信息分类采用线分类法(也称层次分类法),是将初始的分类对象按所选定的若干个属性或特征,逐次地分成相应的若干个层次的类目,并排成一个有层次的、逐级展开的分类体系。线分类法层次性好,能比较好地反映类目之间的逻辑关系,实用方便,既符合手工处理信息的传统习惯,也方便计算机的运行处理。
3.2分类设计根据信息分类原则,结合《全国主要产品分类与代码》(GB/T7635-2002)、行政级别分类、《国民经济行业分类》(GB/T4754-2002)A门类以及农业生产结构特点,将农村社会经济统计信息分成5个等级:5个行政级别类,5个大类,10个中类,70个小类,900个细类。在数据库结构设计中,每一层都留有足够的空间用于类别的扩充。
行政级别类:是按照行政区划级别进行划分,依次为省级、市级、县级、乡级、村级。
大类:是依照国民经济行业分类原则而建立的类别,依次分为种植业、林业、畜牧业、渔业和其他农林牧渔业产品。
中类:是大类中按照生物学科和农业学科基于生产实践中种养的植物、动物划分成若干分支的类群,如种植业下分粮食作物、蔬菜等。
小类:是中类按照生物学科和农业学科分类法细分成若干分支的类群,如果粮食作物下的小类可划分为谷物、豆类、薯类、油料等。
细类:是小类中细分的基本单位,也是各级单位的起点,即物种(简称“种”),如具有北方特色的谷物主要有玉米、谷子、高粱等等。
3.3编码规则编码规则是分类编码体系的具体表现形式,它是根据统计数据的各种属性特征来规定编码的每一位取值和对应的含义,进而约束代码的制定。编码要反映出其对应统计数据的属性和主要特征,以区分不同统计信息的类别。
4分类编码实例
农村社会经济统计信息编码设计首先确定编码对象。例如编码A01的对象是种植业下的粮食作物。其次建立编码、分层和各码位的规范取值规则,对每一编码对象制定码长。农村社会经济统计信息分类采用9位编码,分6个层次。第1层用英文字母z表示指标标识,第2层用数字1~5表示,第3层用英文字母表示,与GB/T4754—2002A门类中大类的代码相对应,余下3层用数字01~99表示。第3层的代码从A~E,其余3层代码从“01”编至“99”,各码位代表相应的类别。每一层的编码采用数字顺序编码,动态递增产生系列顺序代码号,随着编码的增加而产生新的信息类别代码。其代码结构见图1。
如Z1A010101(稻谷)的结构为:z为指标标识,1为省级指标,为种植业,0l为粮食作物,01为谷物;01为稻谷。最后编制类别代码表(后4层),对每一编码对象按既定的编码规则编制出该编码的数据元素的所有取值表(表1)。
5结论与讨论
农村社会经济统计信息分类编码是一项庞大的、复杂的、基础的系统工程,具有很强的逻辑性和理论性,强调科学性和系统性的有效统一,更注重理论和实践的结合应用。研究针对农村社会经济统计信息特点,综合现有的统计信息分类标准建立了编码标准,并在此基础上建立了统计信息分类数据库,制定了国家及省市级标准《农村社会经济统计信息分类与编码》,提高了农村社会经济统计信息采集、检索、共享的效率,对农村社会经济资源整合起到了重要作用,促进了农村社会经济统计信息规范化管理和信息系统建设。
由于每一个具体的信息具有多方面的属性特征,因此具体分类中标准的确定是一个复杂的问题。标准的确定关系到分类系统的完整性和一致性,每种分类系统的科学性与实用性还要在具体的应用中加以验证。