2012年中央财经大学432统计学[专业硕士]考研真题及详解
一、单项选择题(本题包括1~20题共20个小题,每小题1.5分,共30分)
1研究如何利用样本数据来推断总体特征的统计学方法是( )。
A.描述统计
B.理论统计
C.推断统计
D.应用统计
【答案】C
【解析】统计学主要分为描述统计学和推断统计学。描述统计是指描绘(describe)或总结(summarize)观察量的基本情况的统计方法总称。推断统计是研究如何利用样本数据来推断总体特征的统计方法。推断统计学非常有用,因为它允许给予有限的信息(样本)对总体得出结论。
2根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是( )。
A.名义尺度
B.顺序尺度
C.差距尺度
D.比例尺度
【答案】A
【解析】A项,名义尺度又称为定类尺度,它是对个体进行类别划分的测度计量尺度。所使用的数值,用于表现它是否属于同一个人或物。B项,顺序尺度所使用的数值的大小,是与研究对象的特定顺序相对应的;C项,差距尺度所使用的数值,不仅表示测定对象所具有的量的多少,还表示它们大小的程度即间隔的大小;D项,比例尺度测定值的差和比都是可以比较的。
3某市场调查公司为了对一家大型商场做顾客满意度调查,对不同性别和年龄的顾客按事先规定的人数随意进行了一些调查询问,这种调查属于( )。
A.任意调查
B.立意调查
C.配额抽样
D.整群抽样
【答案】C
【解析】A项,任意抽样又称为便利抽样或偶遇抽样,它是任由调查者的便利而随意选取一些个体作为样本。B项,立意抽样又称判断抽样,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法;C项,配额抽样也称定额抽样,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式;D项,整群抽样又称聚类抽样,是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群,然后以群为抽样单位抽取样本的一种抽样方式。
4变量x与y的相关系数的符号取决于( )。
A.变量x的标准差
B.变最y的标准差
C.变量x和y两标准差的乘积
D.变量x和y的协方差
【答案】D
【解析】随机变量x和y相关系数r的计算公式为:
分子为随机变量x和y的协方差,即:
由于分母始终为正,故随机变量x和y的相关系数符号和协方差符号一致。
5有一个样本容量为10的样本,其均值为1300小时,方差为8175.56。若按放回抽样计算,则样本均值的标准误是( )。
A.28.35小时
B.28.59小时
C.29.61小时
D.30.02小时
【答案】B
【解析】在重复抽样情况下,样本均值的标准误为:
6如果时间序列的环比增长量大致相等,则应采用的趋势模型为( )。
A.直线趋势模型
B.指数曲线趋势模型
C.二次曲线趋势模型
D.修正指数曲线趋势模型
【答案】A
【解析】对于给定的时间序列,究竟选择哪个趋势模型应该根据该时间序列本身的变动特点和其图形形状来定。A项,如对于年度资料时间序列,若其逐年增长量又称环比增长量大致相等,则应采用直线趋势模型;B项,若其逐年发展速度即环比发展速度大致相等,则应采用指数曲线趋势模型;C项,若其二级增长量大致相等,则应采用二次曲线趋势模型;D项,若其环比增长量的环比发展速度大致相等,则应采用修正指数曲线模型。
7移动平均法是通过计算逐项移动的序时平均数,来形成派生数列,从而达到( )对数列的影响。
A.消除偶然因素引起的不规则变动
B.消除非偶然因素引起的不规则变动
C.消除绝对数变动
D.消除计算误差
【答案】A
【解析】平稳时间序列通常只含有随机成分,其预测方法主要有简单平均法、移动平均法和指数平滑法等,这些方法主要是通过对时间序列进行平滑以消除其随机波动。
8Q为销售量,P为价格,当∑Q0P0=120万元,∑Q1P1=165万元,∑Q1P0=135万元,∑Q0P1=140万元时,按一般原则计算的销售量总指数是( )。
A.112.5%
B.116.7%
C.117.9%
D.122.2%
【答案】A
【解析】销售量总指数通常是以基期价格为同度量因素,即:销售量总指数=∑Q1P0/∑Q0P0=135/120=112.5%。
9用简单随机重复抽样方法选择样本单位,如果要使抽样平均误差降低50%,则抽样单位数需要增加到原单位数的( )。
A.2倍
B.3倍
C.4倍
D.1倍
【答案】C
【解析】抽样平均误差是反映抽样误差一般水平(即抽样指标与总体指标的平均离差程度)的指标,它的实际含义是指抽样平均数(或成数)的标准差。在重复抽样情况下其计算公式为
则要使变为原来的一半,需要将抽样单位数n扩大至原来的四倍。
10根据抽样调查资料,某企业工人生产定额平均完成105%,抽样平均误差为1%,置信概率为0.9545(t=2)时,可以确定该企业生产定额平均完成百分比( )。
A.大于107%
B.在104%和106%之间
C.在103%和107%之间
D.小于103%
【答案】C
【解析】总体比例π在1-α置信水平下的置信区间为:
11下面对矩估计法中原点矩和中心矩表述正确的是( )。
A.样本的一阶原点矩就是样本的原数据值
B.样本的一阶原点矩就是样本的均值
C.样本的二阶原点矩就是样本的均值
D.样本的二阶中心矩就是样本的标准差
【答案】B
【解析】
称mk为X的k阶原点矩;
称vk为X的k阶中心矩,可见均值E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩。
12下面变量中属于顺序变量的是( )。
A.职业
B.产品产量
C.年龄
D.产品等级
【答案】D
【解析】顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
13当对单个正态总体均值检验时,如果总体方差未知则应该进行( )。
A.Z检验
B.F检验
C.t检验
D.卡方检验
【答案】C
【解析】在大样本情况下一般可以使用z统计量。在样本量较小的情况下,如果总体标准差已知,样本统计量服从正态分布,这时可以采用z统计量;如果总体标准差未知,进行检验所依赖的信息有所减少,这时只能使用样本标准差,应该采用t统计量,样本统计量
由于题设中未给出样本量大小的信息,故保险起见采用t检验。
14某种产品的单位成本y(元/件)对产量x(千件)的回归方程为=90-0.5x,其中“-0.5”的意义是( )。
A.产量每增加1千件,单位成本下降0.5元
B.产量每增加1千件,单位成本平均下降0.5元
C.产量每增加1千件,单位成本下降50%
D.产量每增加1千件,单位成本平均下降50%
【答案】B
【解析】一元线性回归方程的估计为:=0+1x,其中0是回归直线在y轴上的截距,是当x=0时y的期望值;1是直线的斜率,它表示当x每变动一个单位时,y的平均变动值。
15制定一个完整的统计调查方案,不包括( )。
A.确定调查目的
B.明确调查对象和调查单位
C.选择调查方式方法
D.确定调查结果的公布时间
【答案】D
【解析】统计调查方案的主要内容包括:调查目的、调查的对象和调查单位、调查项目和调查表格、调查时间、调查方法和组织方式、调查经费预算等。其中调查时间包含两个方面的含义:一是调查资料所属的时间,二是调查工作的起止时间。
16在线性回归模型中,根据判定系数R2与F统计量的关系可知,当R2=0时,有( )。
A.F=-1
B.F=0
C.F=1
D.F=∞
【答案】B
【解析】回归平方和占总离差平方和的比例称为判定系数,记为R2,即R2=SSR/SST。则有F统计量与R2的关系为:
其中k为自变量个数,故当R2=0时,有F=0。
17回归分析中的估计标准误差( )。
A.可以是负值
B.等于因变量的平方根
C.是根据残差平方和计算的
D.等于自变量的平方根
【答案】C
【解析】估计标准误差是度量各实际观测点在回归直线周围的散布状况的一个统计量,是对误差项ε的标准差的估计,等于均方残差(MSE)的平方根,用Se来表示。其计算公式为:
18在线性回归模型中,若|ei|与之间存在线性关系,则异方差形式为( )。
A.σi2=σ2xi
B.σi2=σ2
C.σi2=σ2
D.σi2=σ2xi2
【答案】A
【解析】随机误差项的方差σi2的估计为∑ei2/(n-k-1)。当|ei|与之间存在线性关系时,ei2与解释变量xi之间存在线性关系,从而σi2与xi之间存在线性关系。即此时线性回归模型存在异方差性,其异方差形式为σi2=σ2xi。
19在DW检验中,无序列相关的区间为( )。
A.0≤DW≤du
B.du<DW<4-du
C.4-du≤DW≤4-dl
D.4-du≤DW≤4
【答案】B
【解析】德宾-沃森(Durbin-Watson)检验简称D-W检验,是目前检验自相关性最常用的方法,但它只适用于检验一阶自相关性及小样本情况。D-W检验统计量DW=2(1-r),其中r为序列的自相关系数。当r→0时,D→2;当r→1时,D→0;当r→-1时,D→4。根据样本容量n和解释变量数目k,在给定显著性水平下,建立D-W检验统计量的下临界值dl和上临界值du,确定具体的用于判断的范围。当0<DW<dl时,存在正序列相关;dl<DW<du时,不能确定;当du<DW<4-du时,无序列相关;4-du<DW<4-dl时,不能确定;4-dl<DW<4时,存在负序列相关。
20对一组数据的描述统计分析表明,样本均值=12.45美元,中位数=9.21美元,方差=22.85。由此可以计算样本数据的离散系数为( )。
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数(coefficient of variation),它是一组数据的标准差与其相应的平均数之比。其计算公式为:vs=s/,得到
二、简答题(本题包括1~5题共5个小题,每小题10分,共50分)。
1简述古典概率法和经验概率法如何定义事件发生的概率。
答:古典概率法简单直观,不需要做大量重复试验,而是在经验事实的基础上,对被考察事件的可能性进行逻辑分析后得出事件发生的概率。其基本思想如下:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:
经验概率法是在大量重复试验中,用频率的稳定值去获得事件发生概率的一种方法。其基本思想如下:若与某一事件A有关的随机现象可大量重复进行,则在n次重复试验中事件A出现的频率=事件A发生的次数/n;随着试验重复次数n的增加,事件A出现的频率会稳定在某一常数附近,这个频率的稳定值就称为其经验概率。
古典概率与经验概率的区别在于,古典概率的计算需要知道总体参数,而经验概率只需通过样本情况估算。如:对于事件“抛掷一枚硬币正面向上”,其古典概率为0.5,经验概率则可以用抛掷100次硬币时正面向上的频率来估计。
2在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。
答:抽样调查(sampling survey)是一种非全面调查,它是从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。根据抽选样本时是否遵循随机原则(要求所有调查单位都有一定的概率被抽取),抽样调查可以分为概率抽样和非概率抽样。概率抽样在对总体的某些特征作出估计推断时,可以对推断可能出现的误差从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。第二,能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。
3举例说明什么是列联表的独立性检验。
答:变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法进行研究。对于定性变量的研究,如患癌症是否与吸烟有关、喜不喜欢数学是否与性别有关、年龄和喜欢的电视节目类型是否有关等等,我们可以对其进行列联表的独立性检验。列联表的独立性检验是针对于定性变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。
独立性检验就是分析列联表中行变量和列变量是否相互独立。
例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对其员工进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:
按照假设检验的步骤:
设定假设:
H0:Pij=Pi*·P*j(行变量与列变量独立)
H1:Pij≠Pi*·P*j(行变量与列变量不独立)
其中,Pi*是行变量的边缘分布概率,P*j是列变量的边缘分布概率。
选取检验统计量:
其中,nij为列联表中第i行第j列类别的实际频数;eij为列联表中第i行第j列类别的期望频数;并且
最后带入数据,计算出c2统计量的观测值。当c2>cα2时,拒绝原假设,认为行向量与列向量不独立,即年龄和喜欢的节目类型有关系。
4给出显著性检验中,P值的含义,以及如何利用P值决定是否拒绝原假设。
答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小;而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P值越小,我们拒绝原假设的理由就越充分。
从研究总体中抽取一个随机样本,计算检验统计量的值和及其对应的P值(即在假设为真的前提下,检验统计量大于或等于实际观测值的概率)。如果P<0.01,说明是较强的判定结果,拒绝原假设;如果0.01<P<0.05,说明是较弱的判定结果,可以拒绝原假设;如果P>0.05,说明结果更倾向于不拒绝原假设。
即一般以P<0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。但是,P值不能赋予数据任何重要性,只能说明某事件发生的机率。P<0.01时样本间的差异比P<0.05时更大,这种说法是错误的。
5给出在一元线性回归中:
(1)相关系数的定义和直观意义;
(2)判定系数的定义和直观意义;
(3)相关系数和判定系数的关系。
答:(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r。样本相关系数的计算公式为:
按上述计算公式计算的相关系数也称为线性相关系数,或称为Pearson相关系数。r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。当r的绝对值越接近于1时,两个变量之间的线性相关关系越强;而当r=0时,只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的解释。
(2)回归平方和占总离差平方和的比例称为判定系数,记为R2,其计算公式为:
判定系数R2测度了回归直线对观测数据的拟合程度。R2的取值范围是[0,1],R2越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,能用x的变化来解释的y值变差的部分就越多,回归直线的拟合程度就越好;反之,R2越接近于0,回归直线的拟合程度就越差。
(3)在一元线性回归中,相关系数实际上等于判定系数的平方根,并且其正负符号和回归方程中回归系数的正负符号相同。
三、计算与分析题(本题包括1~3题共3个小题,第1题10分,第2、3题30分,共70分)
1.盒子中有10个球,6个红球和4个黑球,无放回随机选出4个球。计算选出球中包含黑球数的期望和方差。
解:设X为所取的4个球中包含黑球的个数,则:
所以选出球中包含黑球数的期望为8/5,方差为16/25。
2美国会计学会最近进行了一项研究,比较在政府或私人会计部门的男女雇员的周工资。研究收集20个个体,数据见表1。关于周工资的含交互作用的双因素方差分析结果见表2。
就上述结果,试写一份报告,解释美国会计行业中工作部门和性别对员工工资的影响。报告中至少涵盖以下内容:
(1)不同行业、不同性别员工的平均周工资情况。
(2)结合表2,用方差分析的术语解释行业、性别、以及二者的交互作用对员工工资是否有影响。
答:美国会计行业中工作部门和性别对员工工资的影响报告
(1)不同行业、不同性别员工的平均周工资情况统计:
设部门为因素A,性别为因素B,政府部门为A1,私人部门为A2,男性为B1,女性为B2,计算不同行业员工的平均周工资如下:
(A1)=(978+1035+964+996+1117+863+975+999+1019+1037)/10=998.3(美元)
(A2)=(1335+1231+1236+1317+1211+1079+1160+1063+1110+1093)/10=1183.5(美元)
同理计算得到不同性别员工的平均周工资如下:
(B1)=1142(美元)
(B2)=1047(美元)
不同行业、不同性别员工的平均周工资如下:
(A1×B1)=1018(美元)
(A1×B2)=993(美元)
(A2×B1)=1266(美元)
(A2×B2)=1101(美元)
(2)方差分析及结论
由表2结果可知:
FA=52.77669,P值为1.89×10-6,在显著性水平为0.05时,拒绝原假设,认为不同部门员工的周工资有显著差异,即部门这个因素对员工工资有显著影响。
FB=16.0717,P值为0.001013,在显著性水平为0.05时,拒绝原假设,认为不同性别员工的周工资有显著差异,即性别这个因素对员工工资有显著影响。
FA×B=6.068473,P值为0.025478,在显著性水平为0.05时,拒绝原假设,认为不同行业不同性别员工的周工资有显著差异,即认为行业和性别的交互作用对员工工资有显著影响。
3某艺术家想研究拍卖会上油画价格和油画年龄的关系。研究收集25个样本,数据见表3。以油画价格为因变量,油画年龄为自变量建立一元线性回归模型,结果见表4。
就上述结果,试写一份报告,解释油画年龄如何影响油画价格。报告中至少涵盖以下内容:
(1)油画年龄如何影响油画价格的线性模型是什么?
(2)前述模型是否合理?
(3)按前述模型,哪些油画被低估了。
解:(1)由表4可以得到,估计的线性回归方程为:=2636.78+17.31X
回归系数1=17.31表示:油画年龄每增加1年,油画价格平均增加17.31个单位。
(2)回归系数显著性检验的p值近似为0,表明回归系数显著,即油画年龄是影响油画价格的显著性因素,故初步判断前述模型合理。
(3)对于年龄最大(X=106)的油画,其价格的估计值为4471.64。因此可知道那些实际价格大于4471.64的油画的价格一定被低估了,经计算第20幅至第25幅油画的价格均被低估。另外第4幅油画和第16幅油画的年龄都是71,而第16幅油画的价格较高,经计算可知第16幅油画的价格也明显被估低。
报告略。