第一部分 名校考研真题
2013年中央财经大学432统计学[专业硕士]考研真题及详解
一、单项选择题(每小题1.5分,共30分)
1.在假设检验中,原假设与备择假设( )。
A.都有可能被接受
B.都有可能不被接受
C.只有一个被接受而且必有一个被接受
D.原假设一定被接受,备择假设不一定被接受
【答案】C
【解析】原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。
2.小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,应选择( )。
A.直方图
B.散点图
C.饼图
D.折线图
【答案】B
【解析】C项,饼图主要用于定性数据,表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。A项,直方图是用于展示分组数据分布的一种图形;B项,散点图是用二维坐标展示两个变量之间关系的一种图形;D项,折线图主要用于反映现象随时间变化的特征。
3.若一元回归方程中的回归系数为0,则自变量和因变量相关系数( )。
A.r=1
B.r=-1
C.r=0
D.r无法确定
【答案】C
【解析】相关系数的计算公式为:
回归系数β(∧)i的计算公式为:
则
据此可知,回归系数与相关系数的符号一致,且当一元回归方程中的回归系数为0时,相关系数也为0。
4.某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( )。
A.230
B.200
C.210
D.180
【答案】A
【解析】对于求开口组的组中值公式为:首组开口组组中值=组上限-邻组组距的一半;末组开口组组中值=组下限+邻组组距的一半。由于题目要求的是末组开口组的组中值,为:200+(200-170)=230。
5.计算平均增长率最适宜的方法是( )。
A.算术平均数
B.调和平均数
C.几何平均数
D.加权平均数
【答案】C
【解析】增长率也称增长速度,通常情况下其计算方法为时间序列中逐期环比值(也称环比发展速度)的几何平均数减1。因此,计算平均增长率最适宜的方法是几何平均数。
6.抽样推断的精确度和抽样误差的关系是( )。
A.前者高说明后者小
B.前者高说明后者大
C.前者变化而后者不变
D.两者没有关系
【答案】A
【解析】估计误差越小,估计的精度就越好;估计误差越大,估计的精度就越差。
7.受极端数值影响最大的变异指标是( )。
A.极差
B.平均差
C.标准差
D.方差
【答案】A
【解析】极差是指一组数据的最大值与最小值之差。根据定义可知,极差直接由数据两端的信息计算得出,因此它极容易受极端值的影响。
8.分别采用重复随机抽样和不重复随机抽样,两者样本均值的期望值( )。
A.相等
B.有时相等,有时不等
C.前者小于后者
D.后者小于前者
【答案】A
【解析】在无限总体情况下,设总体均值为μ,总体方差为σ2;则重复随机抽样的样本均值服从期望为μ,方差为σ2/n的正态分布,不重复随机抽样的样本均值服从期望为μ,方差为的正态分布。据此可知,采用重复随机抽样和不重复随机抽样,两者样本均值的期望值是相等的,但是前者方差比后者大。
9.在假设检验中,不能拒绝原假设意味着( )。
A.原假设肯定是正确的
B.原假设肯定是错误的
C.没有充分证据证明原假设是正确的
D.没有充分证据证明原假设是错误的
【答案】D
【解析】不拒绝原假设意味着所构造的与原假设相矛盾的小概率事件没有发生,但可能还有许多其他的与原假设矛盾的小概率事件存在,只能解释为“在当前样本及显著性水平α下没有发现充足的证据反对H0”。
10.某商店销售量增长10%,商品零售价格也增长10%,则商品销售额增长( )。
A.25%
B.15%
C.20%
D.21%
【答案】D
【解析】销售额=销售量×销售价格,销售量增长10%,商品零售价格也增长10%,则商品销售额增长=(1+10%)×(1+10%)-1=21%。
11.已知P(A)=P(B)=1/3,P(A|B)=1/6,P(AB)=( )。
A.7/18
B.11/18
C.1/3
D.1/4
【解析】由于P(A|B)=P(AB)/P(B)=1/6,根据已知条件P(B)=1/3,可解得P(AB)=1/18,本题无正确答案。
12.设两个相互独立的随机变量X与Y分别服从正态分布N(0,1)和N(1,1),则( )。
A.P{X+Y≤0}=0.5
B.P{X+Y≤1}=0.5
C.P{X-Y≤0}=0.5
D.P{X-Y≤1}=0.5
【答案】B
【解析】随机变量X与Y相互独立,X~N(0,1),Y~N(1,1),则有Y-1~N(0,1),且X+Y-1~N(0,2),因此P{X+Y-1≤0}=0.5,即P{X+Y≤1}=0.5。
13.设X与Y为两随机变量,且D(X)=4,D(Y)=1,ρXY=0.6,则D(3X-2Y)=( )。
A.40
B.34
C.25.6
D.17.6
【答案】C
【解析】D(3X-2Y)=32D(X)-2Cov(3X,2Y)+22D(Y),根据已知条件
可得:Cov(X,Y)=1.2,从而Cov(3X,2Y)=3×2Cov(X,Y)=7.2,则故D(3X-2Y)=25.6。
14.若随机变量X服从参数为λ的泊松分布,则X2的数学期望是( )。
A.λ
B.1/λ
C.λ2
D.λ2+λ
【答案】D
【解析】根据已知条件可知X~P(λ),则
15.设X1,X2,…,Xn是来自于正态总体N(μ,σ2)的简单随机样本,`X为样本方差,记
则服从自由度为n-1的t分布的随机变量是( )。
A.
B.
C.
D.
【答案】A
【解析】当总体服从正态分布N(μ,σ2)时,样本均值`X~N(μ,σ2/n)。则有
而
故
即
16.设总体X均值μ与方差σ2都存在,且均为未知参数,而X1,X2,…,Xn是该总体的一个样本,`X为样本均值,则总体方差σ2的矩估计量是( )。
A.
B.
C.
D.
【答案】C
【解析】
因此总体方差σ2的矩估计量为
17.在假设检验时,若增大样本容量,则犯两类错误的概率( )。
A.都增大
B.都减小
C.都不变
D.一个增大一个减小
【答案】B
【解析】在样本容量不变的条件下,α与β常常呈现反向的变化,即如果减小反第一类错误的概率α,就会增大犯第二类错误的概率β;若减小β,则会增大α。增大样本量会使犯两类错误的概率α和β同时变小。
18.在复合假设检验中,“=”一般放在( )。
A.原假设上
B.备择假设上
C.可以放在原假设上,也可以放在备择假设上
D.有时放在原假设上,有时放在备择假设上
【答案】A
【解析】在复合假设检验中,为便于控制犯第一类错误的概率,通常将等号放在原假设上。
19.当峰度系数等于0时,次数分布曲线为( )。
A.尖顶峰度
B.标准峰度
C.平顶峰度
D.U型分布
【答案】B
【解析】峰度是描述分布尖峭程度和(或)尾部粗细的一个特征数。峰度通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰度系数为0;如果峰度系数大于0,此时为尖峰分布;如果峰度系数小于0,此时为扁平分布。
20.样本X1,X2,…,Xn来自正态总体N(μ,σ2),t统计量适用于( )。
A.μ未知,检验σ2=σ02
B.μ已知,检验σ2=σ02
C.σ2未知,检验μ=μ0
D.σ2已知,检验μ=μ0
【答案】C
【解析】在大样本情况下一般可以使用z统计量。在样本量较小的情况下,如果总体方差已知,样本统计量服从正态分布,这时可以采用z统计量;如果总体方差未知,进行检验所依赖的信息有所减少,这时只能使用样本标准差,应该采用t统计量。AB两项,采用的是χ2检验。
二、简答题(本题包括1~5题共5个小题,每小题10分,共50分)。
1.简述非抽样误差类型。
答:非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:
(1)抽样框误差,是指抽样框中的单位与研究总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。
(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。
(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。
(4)调查员误差,是指由于调查员的原因而产生的调查误差。
(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。
2.简述描述离散程度的统计量和适用类型。
答:衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。
(1)极差是指一组数据的最大值与最小值之差。用R表示,其计算公式为:R=max(xi)-min(xi)
极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理解。
(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号,然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。
3.简述估计量的无偏性,有效性和一致性。
答:(1)无偏性
若估计量θ(∧)的数学期望等于未知参数θ,即:E(θ(∧))=θ,则称θ(∧)为θ的无偏估计量。
估计量θ(∧)的值不一定就是θ的真值,因为它是一个随机变量;若θ(∧)是θ的无偏估计量,则尽管θ(∧)的值随样本的不同而变化,其期望值总是等于θ的真值。
(2)有效性
设θ(∧)1=θ(∧)1(X1,X2,…,Xn)与θ(∧)2=θ(∧)2(X1,X2,…,Xn)都是θ的无偏估计量,若对于任意θ∈Θ,都有D(θ(∧)1)≤D(θ(∧)2)且至少对于某一个θ∈Θ上式中的不等号成立,则称θ(∧)1较θ(∧)2有效。
(3)一致性(相合性)
如果θ(∧)n依概率收敛于θ,即"ε>0有:
则称θ(∧)n是θ的一致估计量。
4.简述相关系数和函数关系的差别。
答:变量之间的关系可分为两种类型:函数关系和相关关系。
(1)函数关系
设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数。由此可见函数关系是一种自变量与因变量间映射的确定性关系。
(2)相关关系
相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值与之相对应按某种规律在一定范围内波动。这是一种非确定的关系。
5.简述时间序列的组成要素。
答:时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;
(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;
(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动,其周期通常在一年以上;
(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
三、计算与分析题(本题包括1~4题共4个小题,第1、2题每题10分,第3、4题每题25分,共70分)
1.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):
求该校大学生平均上网时间的置信区间,置信水平为95%(z0.025=1.96)。
解:抽取的样本容量n=36为大样本,根据中心极限定理,样本均值经过标准化以后的随机变量服从标准正态分布,即
此时可用样本方差代替总体方差,则总体均值在置信水平为95%下的置信区间为:
根据表格中的数据可求得:`x=3.3小时,s=1.6小时,z0.025=1.96。
代入数据可得该校大学生平均上网时间在置信水平为95%下的置信区间为:(2.78,3.82)。
2.一学生接连参加同一课程的两次考试。第一次及格的概率为P,若第一次及格则第二次及格的概率也为P;若第一次不及格则第二次及格的概率为P/2。若至少有一次及格则他能取得某种资格,求他取得该资格的概率。
解:设事件A为第一次及格,事件B为第二次及格,事件C为至少有一次及格。
则有:P(A)=P,P(B|A)=P,P(B|A(_))=P/2。则至少有一次及格的概率:
即他取得该资格的概率为
3.一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。下面是获得的月销售额数据(单位:万元)。
对上述数据做双因素交互效应方差分析,结果如下:
根据上述信息,撰写一份研究报告,报告至少涵盖下面三项内容:
(1)竞争者的数量对销售额是否有显著影响;
(2)超市的位置对销售额是否有显著影响;
(3)竞争者的数量和超市的位置对销售额是否有交互影响。
解:(1)设竞争者数量为因素B,由方差分析的输出结果可计算得到:
由于竞争者数量的不同产生的组间离差平方和为:MSB=5028.0000-930.6667-1042.2220-2340.6770=714.4443其自由度为:35-2-6-24=3,则其F检验统计量的值为:
F=MSB÷MSE=714.4443/3÷97.5278=2.44<F0.05(3,24)=3.01
故不能拒绝原假设,即没有证据表明竞争者的数量对销售额有显著影响。
(2)由方差分析的输出结果可直接知道,超市位置这个因素的F检验的p值=0.018<0.05,故拒绝原假设,认为超市的位置对销售额有显著影响。
(3)由方差分析的输出结果可直接知道,对竞争者数量和超市位置的交互作用F检验的p值=0.1457>0.05,故不能拒绝原假设,即没有证据表明竞争者的数量和超市的位置对销售额有交互影响。
4.一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据。
以月销售收入为因变量,电视广告费用和报纸广告费用为自变量,得到结果如下:
根据上述信息,撰写一份报告,报告至少涵盖下面三项内容:
(1)回归方程的假定;
(2)电视广告费用对月销售收入的作用;
(3)报纸广告费用对月销售收入的作用。
解:(1)由输出结果可得回归方程:y(∧)=81.9401+2.7687x1+1.2929x2
回归方程的假定条件是:①因变量y与自变量x之间具有线性关系。②在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。③误差项ε是一个期望值为0的随机变量,即E(ε)=0。④对于所有的x值,ε的方差σ2都相同。⑤误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。
(2)回归系数β(∧)1=2.7687表示,在其他条件不变的情况下,电视广告费用每增加1万元,月销售收入平均增加2.7687万元。由于P-value=0.0010<α=0.05,回归系数显著性检验通过,说明电视广告费用对月销售收入具有显著影响。
(3)回归系数β(∧)2=1.2929表示,在其他条件不变的情况下,报纸广告费用每增加1万元,月销售收入平均增加1.2929万元。由于P-value=0.0063<α=0.05,回归系数显著性检验通过,说明报纸广告费用对月销售收入具有显著影响。