1.1 复习笔记
一、次数分布表与图
(一)次数分布及其表达方式概述
1.含义
次数分布,指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内所出现的次数情况。
2.次数分布表与图
(1)次数分布表:将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表。
(2)次数分布图:将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用图形来表达,即次数分布图。
(二)次数分布表的编制
1.简单次数分布表
简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表的主要步骤如下:
(1)求全距
全距也称为极差,是指一批数据中最大值与最小值之间的差距。观察全部数据,找出其中的最大值(Max)和最小值(Min),以符号R表示全距,则全距的计算公式为:
(2)定组数
定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号K表示。
①组数大小依据数据的多少而定
组数太多,往往会削弱对数据分组整理的功用;太少,又可能会湮没数据内含的重要信息。一般来说,当一批数据的个数在200个以内时,组数可取8~18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即:
公式中的N为数据个数。
②注意
事先计划的组数可能与实际分组时因考虑组距取整以及最低一组的起点位置不同而略有差异,这种差异是正常的,最终结果应以实际划归的组数为准。
(3)定组距
组距用符号i表示,其一般原则是取奇数或5的倍数,如1,3,5,7,9,10……等等。具体的取值过程可通过全距R与组数K的比值来取整确定。
(4)写出组限
组限是每个组的起始点界限。例如,表1-1中列出的就是关于组限的几种不同表述方式。
表1-1 组限的五种表述方法(i=5)
建议并一贯采用表1-1中的第三种、第四种或第五种这三种表述方法。对此,作几点说明如下。
①组限与实际组限是两个不同的概念,但它们之间有规律性的联系。
②当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。
(5)求组中值
组中值是各组的组中点在量尺上的数值,其计算公式为:
组中值=(组实上限+组实下限)÷2
不同的组距以及不同的组限,必然会产生不同的组中值。如果为了便于有关运算,希望每组的组中值恰好为整数,那么在组距为奇数的情形下,各组的实下限与实上限的值必然带有小数。为书写上的简便起见,建议采用表1-1中的第三种方法。
(6)归类划记
我们可以设计一个表的格式来记录有关结果并对数据进行归类划记。具体方法可以类似唱票的方式依次把每个数据准确地划归所属的组别,并以“正”号或“”号的记录方式体现表内,便于计数检查。
(7)登记次数
根据划记结果,点计各组的次数f。
2.相对次数分布表
(1)相对次数
相对次数是指各组的次数f与总次数N之间的比值,若以Rf表示相对次数,则Rf=f/N。
(2)相对次数分布表
当把组别、组中值、次数、相对次数拼在一起时,便构成一个相对次数分布表。阅读相对次数分布表时,相对次数较大的组,则说明落入该组内的数据个数占全部数据个数的比例也越多。反之,则越少。
(3)相对次数分布表与简单次数分布表的用途
相对次数分布表与简单次数分布表各有不同的用途,它们既可单独使用,又可联合使用。
①当我们主要对各组的绝对次数感兴趣时,则可编制简单次数分布表。
②相对次数分布表主要能反映各组数据的百分比结构。当我们侧重关心各组次数的相对比例结构时,通常要编制相对次数分布表。
③可以同时考察一批数据的简单次数分布和相对次数分布。
3.累积次数分布表
(1)含义
把组别、组中值以及累积次数拼在一起时,便构成一个累积次数分布表。通过累积次数分布表,可以了解到位于某个数值以下的数据个数有多少。
(2)分类
累积次数分布表分成“以下”累积次数分布表与“以上”累积次数分布表两种。编制“以下”累积次数分布表时,是从表中下面最低组往最高组方向依次累积。
4.累积相对次数分布表和累积百分数分布表
(1)累积相对次数分布表
累积相对次数是对相对次数进行累积的结果。把组别、组中值、累积相对次数拼在一起,就构成一个累积相对次数分布表。
(2)累积百分数分布表
累积相对次数仍然是小数,把这些小数乘上l00,便得到“百分数”,从而可把累积相对次数分布表等价地转换为“累积百分数分布表”。把组别、组中值、累积百分数拼在一起,就构成一个累积百分数分布表。
(3)说明
累积相对次数分布和累积百分数分布均有“以下”分布和“以上”分布两种。在应用时,应根据具体情况决定选用其中的一种。
(三)次数分布图的绘制
次数分布图通常有两种表达方式,包括次数直方图和次数多边图两种。
1.次数直方图
(1)含义
次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。
(2)制作步骤
①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交
a.为使图形美观,通常使横轴与纵轴的长度比为5:3。
b.以纵轴为次数的量尺,按比例等间隔地标出刻度。
c.横轴代表测验分数的量尺,也按适当的比例等间隔地标出次数分布中各组的组中值。
d.一般说来,纵轴和横轴的尺度比例不一样。纵轴刻度往往从0开始,而横轴刻度则须根据最低一组的下限来确定,为了不影响图形的美观,通常不从刻度“0”开始。
②每一直方条的宽度由组距i确定并体现在横轴的等距刻度上。直方条的高度由相应组别的次数f多少决定。所有的直方条以各组的组中值为对称点,沿着横轴,依顺序紧密直立排列。
③在直方图横轴下边标上图的编号和图的题目,并检查图形结构的完整性。
(2)优点与缺点
①优点
次数直方图比较直观形象,能很快地看出各组次数之间的相对大小及结构形态。
②缺点
对于次数直方图,人们不易准确与快速地了解到各组的次数大小。
2.次数多边图
(1)含义
次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。
(2)制作步骤
①画纵轴和横轴的方法及要求与制作上述次数直方图相同,但要求在横轴上最低组与最高组外各增加一个次数f为0的组。
②在两轴所在的直角坐标平面上,分别以每个组的组中值为横坐标,相应的次数为纵坐标,画出各个点。如果原先把数据分成K个组,那么加上两端额外增加的两个次数为0的组后共为(K+2)个组。因此,要在坐标平面上画出(K+2)个点。
③用线段把相邻的点依次连接起来,连同横轴,构成一个闭合的多边形,即次数多边图。
(3)次数分布曲线
从理论上讲,当一批数据的个数足够大时,随着分组时组距的不断变小,绘制成的次数多边图就越来越连续光滑。若分为无数组时,就形成一条极其光滑的曲线,这种曲线在统计学上称为次数分布曲线。
3.相对次数直方图与多边图
相对次数分布图的纵轴是相对次数的量尺。在应用上,有时可能会碰上比较多批不同数据的相对次数,而利用相对次数多边图的特点,可允许在同一个图形中描绘两个或三个不同的相对次数多边图,但要注意:
(1)数据的分组要相同;
(2)要用图注或不同的颜色来区别几个不同的次数多边图。
4.累积次数分布图
(1)含义
①累积次数分布图有直方图式和曲线图式两种,但最为常用的是累积次数曲线图,它是根据累积次数分布或累积相对次数分布制作而成。
②累积次数曲线图的形状不会由于组距的不同而使图形发生较大的变化,因而由抽样数据制成的累积次数曲线图是比较稳定的。
(2)累积次数曲线图的制作方法要领
①纵轴为累积次数的量尺,横轴的意义不变。
②对于“以下”分布来讲,各个坐标点的位置,其横坐标是各组的虚上限,纵坐标是累积的次数。
③用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成S形曲线。同理,可绘制“以上”累积次数曲线图,关键在于正确地找到坐标点的位置。
5.累积相对次数曲线图与累积百分数曲线图
根据累积相对次数分布以及累积百分数分布,可相应地绘制累积相对次数曲线图和累积百分数曲线图。它们的制作方法大体上与上述的累积次数曲线图相同,只是这里的纵轴是关于累积相对次数或累积百分数的量尺。
二、几种常用的统计分析图
次数分布表与次数分布图适用于描述一元连续变量的观测数据,而对于离散性变量的观测数据分析以及对二元变量观测数据之间相关性初探,则要应用其他一些图示方法。
(一)散点图
1.含义
散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。
2.作用
散点图对于探究两种事物、两种现象之间的关系起着重要作用。研究人员可以根据散点图中点群的散布形态,结合自己的专业知识与统计学修养,推测两种事物或两种现象之间的相关程度与联系模式,并进一步采用有关统计技术进行定量描述与深化研究。
3.绘制散点图的主要要求与注意事项
(1)在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量;横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺。
(2)点的描绘依二元观测数据而定,但在具体描绘时应注意用细线画坐标轴,用稍粗黑点描绘各个坐标点,点位置的确定按平面解析几何学中的方法。
(3)注意图形的调和比例及必要的图注说明。
(二)线形图
1.含义
线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。
2.适用情况
线形图适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。
3.优点
线形图对于刻画各个统计事项之间的关系,确实较形象生动。基于线形图,我们既可对有关统计事项进行数量比较,又可看出某种事物或现象的变化趋势。
4.绘制要领
(1)纵横两个坐标轴的画法及量尺设计同上述的散点图。
(2)根据有关统计事项的具体数据,在由纵横两轴所决定的平面上画记圆点,然后用稍粗一些的线段把相邻的点依次连接。
(3)在同一个图形中,允许画若干条(一般不超过五条)不同的线形图,以便比较分析。但要用不同形式的折线,如虚线、实线、点画线或不同颜色的折线等加以区分,并在图形中的适当位置上标明图例。
(三)条形图
条形图是用宽度相同的长条来表示各个统计事项之间的数量关系。
1.条形图与次数直方图的区别
次数直方图中的直方长条是紧密排列的,适用于刻画连续性变量的观测数据。而条形图通常用于描述离散性变量(如属性变量)的统计事项。
2.条形图的种类
(1)简单条形图
①含义
简单条形图是用同类的直方长条来比较若干统计事项之间数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分类的情况。
②绘制条形图的注意事项
a.各个直方长条的宽度要相同,色调要一致。
b.相邻长条之间的间隔要适当,根据统计项目的多少以及直方长条的宽度来权衡。一般说来,这种间距大约为直方长条宽度的0.5~1倍。
(2)复合条形图
①含义
复合条形图,一般是用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法。
②绘制复杂条形图的要求与注意事项。
a.各类直方长条的宽度要相同。
b.不同类型的直方长条宜用不同的色调加以区别,并在图形右上方适当位置标明图例。
c.把要比较的统计事项(二重分类)的直方长条靠在一起,而横轴(基线)上所标明的分类项目(一重分类)的直方长条之间要相互间隔开,其间距一般取长条宽度的0.1~1.5倍。
(四)圆形图
1.含义
①圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。
②整个圆代表所研究事物的总体,各扇形可用不同的色调加以区别,分别代表对总体事物进行分类后的统计事项;扇形的面积比例大小,完全依某一统计事项在其总体事物中的比例大小而定。
③圆形图特别适用于描述具有百分比结构的分类数据。
2.绘制圆形图的要求与注意事项
(1)以适当的半径画一圆,代表事物总体。
(2)分别以各统计事项在其总体中的比例乘以圆周角(即),求出各相应扇形的圆心角。
(3)根据上述计算结果,依次用量角器把整个圆分画成若干个扇形部分,并在其中标上各自的百分比数值。
(4)用不同的色调对不同的扇形加以区分,并在图形的右边标上图例以便阅读。
(5)在图形的适当位置上,注明总体事物的数量,以弥补圆形图中只出现相对数而没出现绝对数的缺陷(也可把总体事物的数量体现在图题中)。
(6)注意整个图形的对称与协调,在图形下边适当位置标上图号与图题,则圆形图绘制完毕。