任务一 统计数据采集认知
一、数据采集的意义
统计作为一种从数量方面认识事物的科学方法,其研究的基础是大量的数据。数据采集是按照统计任务的要求,运用科学方法,有组织、有计划地向客观实际去采集充分的、实事求是的统计数据的过程。它是统计工作的第二个阶段,即统计调查,是对现象总体认识的开始。
大量的统计数据来源于两个方面:一种是原始资料,来自直接的调查和科学试验,也是统计数据的直接来源;另一种是次级资料,来自别人的调查和科学试验,这是统计数据的间接来源,也即二手资料。次级资料是指那些本次统计调查任务之前已经收集,并进行了加工整理,能在一定程度上反映总体特征的资料。它一般可以认为是该总体的历史资料。例如某公司下属10家企业的当年产量、产值、职工人数、利润的有关数据就是原始资料,它有待进一步加工汇总,才能反映该公司(总体)的特征。但为了分析研究这个总体的数量特征变化,还需要收集该公司过去的产量、产值、职工人数、利润等数据,而这些资料是能够反映总体特征的,而且也是已经加工整理的,因此是次级资料。根据研究的需要,次级资料既可以直接使用,也可以对其总体范围、核算方法调整,进行再加工后使用。很明显,任何次级资料都是从原始资料加工整理而来,因此原始资料的收集对统计研究有着特殊的意义。
统计数据采集的基本任务,就是按照已经确定的数据采集指标体系,运用具体的数据采集手段,取得总体单位能以数字资料为主体的各种信息。可以认为数据采集是以大量性和数量性为特点,而不同于其他的一般调查方式。
二、统计数据的种类
统计数据不论其来源如何,都是对客观现象进行计量的结果,对其属性、特征进行分类、标示和计算,称为统计量度或统计测定。由于客观事物有的比较简单,有的比较复杂,有的特征和属性是可见的(如人的外貌体征),有的则是不可见的(如人的信仰和偏好),有的表现为数量差异,有的表现为品质的差异。因此,统计测定也就有定性测定和定量测定的区别。测定的方法不同,得到的统计数据也就不同。据此,可将统计数据区分为品质数据和数量数据。
(一)品质数据
品质数据是定性测定的结果,它是说明事物属性特征的统计数据,用文字来表现。由于定性测定又可分为定类测定和定序测定,因而,品质数据又可区分为分类型品质数据和顺序型品质数据两种。
1.分类型品质数据
分类型品质数据是定类测定的结果。由于定类测定只能按照事物的某种属性对其进行平行的分类或分组,通过定类测定得到的统计数据也称分类数据。分类数据表现为类别,每一类别都用特定的文字或数码来表现,这种数码只是代号而无量的意义。例如,对人口按性别划分为男性和女性两类,男性和女性就是特定的文字。对人口同样也可用1表示男性人口,用0表示女性人口,这些数字只是给不同类别的一个代码,并不意味着这些数字可以区分大小或进行任何数学运算。
2.顺序型品质数据
顺序型品质数据是定序测定的结果。由于定序测定按照事物的某种属性对其进行有序的分类或分组,通过定序测定得到的统计数据也称顺序型数据。顺序型数据也表现为类别,但每一类别之间是可以比较顺序的,且各种类型之间具有某种意义的等级差异。例如,对企业职工按受教育程度划分为大学毕业、中学毕业、小学毕业等。对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。这种排序是确定的,对所研究的问题有特定的意义。但是,它并不能具体测定各等级之间的差距的大小,例如,不可能计算出一级企业与二级企业的有实质意义的量的差距。
(二)数量数据
数量数据是定量测定的结果,它是说明事物数量特征的统计数据,用数值来表现。由于定量测定是使用自然或度量衡单位对事物进行计量的结果,其结果表现为具体的数值,也称为数值型数据。例如,销售收入用人民币元度量,考试成绩用百分制度量,重量用克来度量等,其结果均表现为具体的数值。数值型数据也可以进行分类或分组,且每一类别之间可以比较顺序,各种类型之间也具有某种意义的等级差异。更为重要的是,数值型数据还可以测定不同类型之间间距的大小,进行相应的加减乘除的数学运算。
三、数据采集的种类
由于现象是错综复杂的,调查对象是千差万别的,统计研究的任务也是多种多样的,因此,在进行数据采集时,应根据不同的调查目的和调查对象的特点,灵活采用不同的数据采集方式,这是数据采集工作中的一个重要问题。数据采集的种类,可以从不同角度进行分类:
(一)按数据采集的组织形式不同,分为统计报表和专门调查
(1)统计报表是国家统计系统和专业部门为了定期取得系统、全面的统计数据而采用的一种数据采集的方式,是要掌握经常变动,并对国民经济有重大意义的各种统计数据。
(2)专门调查是为了了解和研究某种情况或问题而专门组织的统计数据采集。它包括抽样调查、普查、重点调查和典型调查等几种数据采集方法。
(二)按数据采集对象包括的范围不同,分为全面调查和非全面调查
(1)全面调查是对构成数据采集对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查,它的目的在于取得比较准确而全面的统计数据。
(2)非全面调查是对数据采集对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查。非全面调查只对一部分单位进行调查,能节约人、财、物力和时间。
(三)按数据采集的时间是否连续,分为连续调查和非连续调查
(1)连续调查又称为经常性调查,是指对研究对象的数据变化进行连续不断的采集,如产品产量、原材料消耗量、利润等,这些数据在观察期内在不断变化,需要连续采集。
(2)不连续调查,又称为一次性调查,是指间隔一段相当长的时间对研究对象某一时刻的数据进行采集,如人口总数、机器设备台数等数据在短期内变化不大,没有必要连续采集数据。不连续调查所获得的数据是反映现象在某一瞬间达到的水平。
(四)按采集数据的方法不同,分为直接调查、凭证调查、采访调查、问卷调查
(1)直接调查又称为直接观察,是由调查人员到现场对调查单位直接查看、测量和计量。
(2)凭证调查是以各种原始和核算凭证为调查资料来源,按统一的表式和要求,向有关部门提供资料的方法。
(3)采访调查是通过指派调查人员对被调查者询问、采访、提出所要了解的问题,以收集资料、采集数据的方法。
(4)问卷调查是以问卷形式提出问题,以回收的问卷来搜集资料、采集数据的方法。
四、数据采集的基本要求
数据采集的基本要求是准确性、及时性、全面性、系统性,它是衡量统计工作质量的重要标志。
(1)准确性。准确性是指采集的数据能客观地反映现象本身状态,具有较小的调查误差。数据采集的准确性,将直接关系最终成果的质量。准确性高,就能为认识研究现象的本质提供充分保证,准确性低,无论以后的整理和分析方法多么严谨,都不仅会造成最终结果的谬误,也使统计工作过程所做的一切成为一种浪费。
(2)及时性。及时性是指采集数据的时效性。采集数据过程所占用的时间越短,其效用越大,越能及时满足数据采集任务的时间要求,就越能使各工作环节顺利延伸。及时性有赖于全部数据填报单位的共同努力,一个填报单位的延误,就会使大量填报单位的及时性受到损害。
(3)全面性。全面性有两个方面的内容:一是填报单位的全面;二是所要登记项目的全面。由于采集的数据具有大量性特点,众多填报单位能否将应该填报的资料上报,会影响汇总资料的质量。而填报项目是否完整,也会影响整理汇总这一环节的顺利开展。
(4)系统性。系统性是指数据采集工作本身的连续性和调查项目的连贯性两个方面的内容。大多数的数据采集工作都需要经常、持续地进行,这样才能够系统地提供数据和保存数据。而在经常持续的调查工作中,为了保证数据的可比性,大多数调查项目必须保持连贯,使数据具有系统性,而有使用价值。这两个方面是相互关联、紧密结合的。
上述四项要求在实践中同时做到会有较大困难,有时还会产生冲突,要处理好它们之间的矛盾,应该做到:准为基础,准中求快,力求全面、系统。