1.2 课后习题详解
1.名词概念
(1)随机变量
答:随机变量(random variable)是在样本空间的全部事件集上的一个实值函数。通常随机变量用大写字母X,Y,Z等表示,或者希腊字母等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,即,,。随机变量X只取两个值: ,,即当某学生是男生时,x取1;当学生是女生时,x取0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在12岁的学生总体中,随机抽一个观测其身高y。此随机试验的样本空间,是大于0的实数集。随机变量y可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随机现象。
(2)总体
答:总体(population),又称“母体”,统计学术语,是指一个统计问题中研究对象的全体。由具有某种研究特征的个体构成。从总体中抽取一部分个体,就构成总体的一个样本。如,研究小学生的推理能力,记X为每个小学生的推理能力,则X的任一个可能取值是一个个体,X的所有可能取值的集合则是一个总体。如果随机抽取n个小学生,测量他们的推理能力为,这就是一个取自总体X的样本。可根据包含个体的数目,可分为有限总体和无限总体。总体本身的大小是有限还是无限,取决于研究问题的推理范围。心理学研究中常为无限总体。在推断统计中被定义为一个随机变量,可运用概率论等数学工具进行统计推断。
(3)样本
答:样本(sample),又称“子样”,统计学术语,是指按一定规则从统计总体中抽取的若干个体的集合或对总体X的n次观测结果()。根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。根据两样本来自的两总体是相关还是独立,可分为相关样本和独立样本。
(4)个体
答:个体(individual),又称“单位”、“样品”,统计学术语,是指总体中的每一个单位、样品或成员。个体是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。在心理学研究中,个体根据研究目的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
(5)次数
答:次数,又称为频数(frequency),是指某一事件在某一类别中出现的数目,用f表示。
(6)频率
答:频率(frequency),①又称“相对频数”。某随机事件A,在N次试验中出现的次数n与试验总次数N的比值。亦称事件A发生的频率。记为,其值介于0~1之间。事件的频率越大,说明它出现的可能性越大;反之则越小。一个事件的频率不是一个固定的数值,与总次数N有关,且即使再重复N次试验,次数n也可能不同。但在大量重复试验中频率具有稳定性,即当试验次数N无限增大时,频率F会在某个固定值上下波动,而且偏差越来越小。②简谐振动基本物理量。物体每秒振动的次数。单位是赫兹(Hz)。在数学关系上频率是物体振动周期的倒数。
(7)概率
答:概率(probability),概率论术语指,随机事件发生可能性大小度量指标。①概率描述性定义。随机事件A在所有试验中发生可能性大小的量值,称为事件A的概率,记为P(A)。如将一枚均匀硬币上抛足够多次,会发现“正面朝上”的事件出现的频率在0.5上下波动。这种频率稳定性从实践上表明随机事件的概率是客观存在的。②概率的精确定义。设P是定义在“事件域”上的一个集合函数,若满足下列条件,则称之为概率:a.P(A)≥0,对一切;b.;c.若两互不相容,则(性质c称为可列可加性)。若P是概率,则不可能事件的概率为零,即对任意事件,有。应当注意,若P(A)=0,并不能说A一定是不可能事件,即不可能事件的概率一定是零,但概率为零的事件未必是不可能事件。这是由于P是集合函数,可能在某些点集上(如有限个点)为零。同理,概率为1的事件,未必是必然事件。
(8)统计量
答:统计量(statistic),统计学术语,指不含未知参数的样本的函数。设有一总体X,(X1,X2,…,Xn)是取自X的一个随机样本,T(X1,X2,…,Xn)是不包含任何未知参数的函数,则称是一个统计量。如,样本均值,是一个统计量,也是一个统计量。在各种不同的统计分析或推断中,并不直接使用随机样本,而是将随机样本“加工”为统计量。在解决不同问题时有不同的统计量,统计量是直接用来进行分析或推断的重要工具。如正态总体,若数学期望μ未知,可用样本均值X去估计;在两个总体的均值差异显著性检验时,要运用Z统计量或t统计量。
(9)参数
答:参数(parameter)在数理统汁中,反映一个统计量或随机变量的分布特征的参变量。对于参数统计来讲,分布依赖的参数是有限个数(其实只确很少几个)。只要参数确定,则分布也确定了。参数可在一定允许范围内取值。它便确定了一个分布族。如正态分布只含有两个参数。它们的取值允许范围是。对于非参数统计来讲,分布依赖的参数不是有限的,其统计方法只能是非参数方法或自由分布方法。
(10)观测值
答:随机变量一旦确定了某个值,就称这个值为随机变量的观测值,也就是具体数据。
2.何谓心理与教育统计学?学习它有何意义?
答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义
①统计学为科学研究提供了一种科学方法
科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。
②心理与教育统计学是心理与教育科研定量分析的重要工具
凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性,而且引起它发生变化的因素甚多,难以准确测量。但是它毕竟还是可以测量的。因此。在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计学就是对心理与教育问题进行定量分析的重要科学工具。
③广大心理与教育工作者学习心理与教育统计学的具体意义
a.可以顺利地阅读国内外先进的研究成果;
b.可以提高心理与教育工作的科学性和效率;
c.为学习心理与教育测量和评价打下了基础。
3.选用统计方法有哪几个步骤?
答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析。只有做到对数据分析正确,才能对统计方法做出正确地选用。
(1)要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。
(2)要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。
(3)要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
4.心理与教育科学实验所获得的数据是否属于随机变量?为什么?
答:心理与教育科学实验所获得的数据属于随机变量。
心理与教育科学研究数据具有随机性和变异性。
科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象。在心理和教育科学领域,研究获得的数据资料也具有一定随机性质。观测数据的这种特点,称为变异性。即便使用同一种测量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同。随着测量工具的完善和精确,数据的这种随机性变化就更明显。例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察多次,得到的数据绝不会全然相同,这些数据总是在一定的范围内变化。
造成数据变异的原因,出自观测过程中一些偶然的不可控制的因素,称随机因素。随机因素使测量产生的误差称作随机误差。由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,并且事前无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。在教育和心理科学的各类研究中,研究的对象是人的内在的各种心理现象,不仅由客观上一些偶然因素会引起测量误差,由实验者和被试主观上一些不可控制的偶然因素也会造成测量误差,这些偶然因素十分复杂,因而造成的随机误差就更大,也就使心理与教育科学研究中得到的数据具有更明显的变异性。
5.怎样理解总体、样本与个体?
答:(1)需要研究的同质对象的全体,称为总体。总体既可以是无限的也可以是有限的。
(2)每一个具体研究对象,称为一个个体。
(3)从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。一般把容量n≥30的样本称为大样本;而n<30的样本称为小样本。
6.统计量与参数之间有何区别和关系?
答:在科学研究中,探寻的是关于所有事物总体的说明和解释。总体的那些特性称为参数(parameter),又称总体参数,是描述一个总体情况的统计指标;样本的那些特征值称为统计量(statistics),又称特征值。
(1)参数和统计量的区别
①一个参数是从整个总体中计算得到的量数,通常是通过样本特征值来预测得到,统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况,参数代表总体的特性,它是一个常数;
②统计量代表样本的特性,它是一个变量,随着样本的变化而变化;
③参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。
(2)参数和统计量的关系
从数值计算上讲,当总体大小已知并与实验观察的总次数相同时,它们是同一统计指标。当总体无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数能够做出预测和估计。
7.试举例说明各种数据类型之间的区别。
答:根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。
(1)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。
①计数数据(count data),是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。
②测量数据(measurement data),又称计量数据是指借助于一定的测量工具或一定的测量标准而获得的数据。
(2)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。
①称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,在教育和心理类调查研究中,有关被试属性的调查资料,大多属于这类数据。
②顺序数据(ordinal data)是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序,不能指出相互间的差别大小这类数据不能进行加减乘除运算。
③等距数据(interval data)是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。只能使用加减运算,不能使用乘除运算。
④比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。
(3)按照数据是否具有连续性,把数据划分为离散数据和连续数据。
①离散数据(discrete data)又称为不连续数据、间断数据。这类数据在任何两个数据点之间所取的数值的个数是有限的。
②连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。至少在理论上从最高到最低之间都可以进一步细分。
8.下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?
(1)17.0千克,(2)89.85厘米,(3)199.2秒,(4)17人,(5)25本,(6)93.5分。
答:上面的数据中测量数据有:(1)17.0千克,(2)89.85厘米,(3)199.2秒,(6)93.5分。
记数数据有:(4)17人,(5)25本。
计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。
9.说明下面符号代表的意义。
答:
10.结合所学心理学知识,谈谈你对心理统计思想的初步理解。
答:在心理发展过程中,个理论学派观点层出不穷,但是他们都有一个共同的特点,并不是单纯的从唯心角度出发,而是客观的用现象、行为和数据来说明心理的各种规律,但是在研究过程中,发现心理的数据有时具有随机性和变异性,但有时又具有规律性,为了研究变异性和规律性,心理学就利用部分数据来推测总体数据的特征,为了更科学的推测和分析,就形成了心理统计思想,并将统计学渗透到心理学的各个分支。
11.熟悉EXCEL软件,初步了解计算机在统计工作中的应用情况。
答:略。