2014年中央财经大学432统计学[专业硕士]考研真题及详解
一、单项选择题(每小题1.5分,共30分)
1.据统计,2012年北京市共招收本、专科学生16.2万人,研究生8.7万人。这里学生的“学历”(专科、本科、研究生)的计量尺度是( )。
A.定类尺度
B.定序尺度
C.定距尺度
D.定比尺度
【答案】B
【解析】定序尺度又称顺序尺度,它是对事物之间等级差或顺序差别的一种测度。该尺度不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。或者说,它不仅可以测度类别差,还可以测度次序差。例如,产品等级就是对产品质量好坏的一种次序测度。很显然,定序尺度对事物的计量要比定类尺度精确一些。因为学历有高低之分,所以对它的计量尺度应为定序尺度。
2.以下北京市2012年的统计指标中属于时期数的是( )。
A.年末常住人口为2069.3万人
B.实现地区生产总值17801亿元
C.年末全市汽车保有量520万辆
D.年末实有城镇登记失业人员7.2万人
【答案】B
【解析】时期数反映的是现象在一段时期内的总量。ACD三项,年末为一时刻,其相应的统计指标属于时点数。B项,北京市2012年实现地区生产总值17801亿元,为2012年这一年内指标的变化,体现了时期性。时期数相加有意义,而时点数相加没有实际意义。
3.已知2012年全年证券市场各类证券成交额85412.9亿元,比上年增长8%。则2011年证券成交额为( )亿元。
A.85412.9×8%
B.85412.9×92%
C.85412.9÷(100%+8%)
D.以上都不对
【答案】C
【解析】增长率=(本期营业额-上期营业额)÷本期营业额×100%,则:上期营业额=本期营业额÷(100%+增长率),由题意:2011年证券成交额=2012年证券成交额÷(100%+增长率)=85412.9÷(100%+8%)。
根据以下数据回答4~5问题:
两组工人加工同一种零件,第一组5人每天加工的零件数分别为:36,25,29,28,26。巧合的是,第二组5人每天加工的零件数分别比第一组的工人多3件:39,28,32,31,29。
4.两组工人加工零件数的方差( )。
A.一组大于二组
B.二组大于一组
C.相同
D.无法比较
【答案】C
【解析】方差是各变量值与其平均数离差平方的平均数,反映数据的绝对离散程度。两组工人人数相同,且第二组工人每天加工的零件数分别比第一组的工人多3件,因此两组数据的绝对离散程度一样,方差相同。
5.两组工人加工零件数的离散系数( )。
A.一组大于二组
B.二组大于一组
C.相同
D.无法比较
【答案】A
【解析】离散系数是一组数据的标准差与其平均数之比,测度数据的相对离散程度。由于两组数据的标准差相同,而第二组数据均值较大,因此二组的离散系数较小。
6.在抽样推断中,需要推断的总体参数是一个( )。
A.统计量
B.已知的量
C.随机变量
D.未知的量
【答案】D
【解析】总体参数是对总体特征的某个概括性的度量。总体参数一般是一个未知的常数,可以利用样本信息来推断。
7.以下关于统计量的说法中错误的是( )。
A.总体参数的无偏估计量是唯一的
B.统计量是随机变量
C.统计量可以根据样本数据计算
D.可以使用不同的统计量来估计同一个总体参数
【答案】A
【解析】统计量是直接从样本计算出的,代表样本的特征。使用不同估计方法得到的估计量可能不同,当估计量的均值等于被估计总体参数的真值时,称其为总体参数的无偏估计量。A项,总体参数的无偏估计量不唯一。
8.以下反映集中趋势的测度指标中,不受极端值影响的是( )。
A.均值
B.中位数
C.众数
D.中位数和众数
【答案】D
【解析】中位数是一组数据中间位置上的代表值,众数是一组数据中出现次数最多的数,二者均不受极端值的影响。均值是所有数据的加和与样本量之比,易受极端值的影响。
9.从0-1分布总体中进行不放回抽样,样本中取值为1的个体数服从( )。
A.两点分布
B.二项分布
C.超几何分布
D.泊松分布
【答案】C
【解析】超几何分布是一种离散型分布。从有限个物件中不放回地抽出n个物件,成功抽出指定种类的物件的次数即服从超几何分布。
10.有一个样本容量为10的样本,其均值为1300小时,方差为8175.56。若按放回抽样计算,则样本均值的标准误是( )。
A.28.35小时
B.28.59小时
C.29.61小时
D.以上都不对
【答案】B
【解析】样本均值的标准误是描述均值抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映样本均数之间的变异。在重复抽样情况下,样本均值的标准误为:
(其中总体标准差σ用样本标准差s来代替)
11.在一项化妆品市场调查中,考虑到男女性别对化妆品的要求有所不同,抽样时分别从男性和女性消费者中独立地随机抽取相同比例的人数作样本,这种抽样方式是( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】分层抽样是先将总体的单位按某种特征分为若干级次层,然后再从每一层内进行单纯随机抽样,组成一个样本。该调查中先将总体按性别分为两层,再从这两层内独立随机抽取,为分层抽样。
12.在单样本t检验中,备择假设是总体均值>1000,则这属于( )。
A.左侧检验
B.右侧检验
C.双侧检验
D.双尾检验
【答案】B
【解析】A项,若假设检验的拒绝区域在样本统计量分布的左端,则称这种单侧检验为左侧检验,它适用于担心样本统计量会显著低于假设的总体参数的情况,其原假设和备择假设为H0:μ≥μ0,H1:μ<μ0
B项,右侧检验的拒绝区域在样本统计量分布的右端,其原假设为H0:µ≤µ0,备择假设为H1:µ>µ0。
CD两项,双侧检验或双尾检验的原假设和备择假设为H0:μ=μ0,H1:μ≠μ0。其目的是观察在规定的显著水平下所抽取的样本统计量是否显著地高于或低于假设的总体参数。
13.某参数估计量的取值随着样本容量的无限增大越来越接近于参数的真值,则表明该估计量符合( )。
A.无偏性
B.一致性
C.有效性
D.充分性
【答案】B
【解析】A项,无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。B项,一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。C项,有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。D项,充分性不属于评价估计量的标准。
14.以下关于抽样误差的说法错误的是( )。
A.其它条件相同时,总体的差异程度越大,抽样误差就越大
B.其它条件相同时,样本容量越大,抽样误差越小
C.不重复抽样中的抽样误差要大于重复抽样
D.在非概率抽样中无法对抽样误差进行控制
【答案】C
【解析】AB两项,影响抽样误差大小的因素主要有:①总体单位标志值的差异程度;②样本单位数的多少;③抽样方法;④抽样调查的组织形式。C项,重复抽样比不重复抽样误差要大些。D项,只有在概率抽样下才能对抽样误差加以控制。
15.我国最近完成的经济普查属于( )。
A.抽样调查
B.经常性调查
C.统计报表制度
D.全面调查
【答案】D
【解析】经济普查是国家为掌握国民经济第二产业、第三产业的发展规模、结构、效益等信息,按照统一的方法、统一标准、统一时间、统一组织对工业、建筑业、第三产业的所有单位和个体经营户进行的一次性全面调查。
16.为了对总体均值进行估计,从总体中直接抽取一个随机样本,测得样本均值为100。则以下说法错误的是( )。
A.样本均值是总体均值的无偏估计
B.样本均值是总体均值的估计量
C.“100”是总体均值的估计值
D.“100”是总体均值的估计量
【答案】D
【解析】在参数估计中,用来估计总体参数的统计量的名称称为估计量,如样本均值、样本方差等;而根据一个具体的样本计算出来的估计量的数值称为估计值。D项,根据样本计算的均值即样本均值是一个估计量,其具体数值100即为估计值。
17.以下关于置信区间的说法正确的是( )。
A.置信区间一定包含待估总体参数的真值
B.置信区间只能以一定概率包含真值
C.置信区间越宽越好
D.以上都不对
【答案】B
【解析】置信区间又称估计区间,用来估计参数的取值范围。AB两项,对于一个区间估计而言,其在所有可能样本下的取值中包含总体参数真值的比例称为它的置信度,因此它只能以一定的概率包含真值;C项,置信区间越宽,参数估计的精确性越低。
18.两个变量的样本相关系数等于0.3,对相关系数进行双侧检验的P值等于0.0375,则以下说法正确的是:( )。
A.在5%的显著性水平下可以拒绝总体相关系数为0的零假设
B.在5%的显著性水平下可以拒绝总体相关系数不等于0的零假设
C.在1%的显著性水平下可以拒绝总体相关系数为0的零假设
D.在1%的显著性水平下可以拒绝总体相关系数不等于0的零假设
【答案】A
【解析】P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小;而这种情况一旦出现了,根据小概率原理,可以拒绝原假设。该题中P值=0.0375<5%,因此可以在5%的显著性水平下拒绝原假设r=0。
19.进行假设检验所依据的基本原理是( )。
A.小概率事件在一次试验中不可能发生原则
B.大数定律法则
C.零假设与备择假设二者必取其一原则
D.依据样本信息推断总体信息原则
【答案】A
【解析】小概率事件在一次试验中发生的概率非常小,如果在一次试验中,在原假设成立的前提下小概率事件发生了,就有理由拒绝原假设。
20.某地区2006~2010年GDP连续5年的环比增长速度为3%,2%,4%,6%和7%,则以2005年为基期,2006~2010年5年的定基发展速度为( )。
A.3%+2%+4%+6%+7%
B.103%×102%×104%×106%×107%
C.103%×102%×104%×106%×107%-100%
D.
【答案】B
【解析】环比增长速度是逐期增长量与前一期发展水平之比的相对数。环比发展速度是以报告期水平与前一时期水平之比计算的发展速度。二者关系为:环比增长速度=环比发展速度-1。定基发展速度是指以报告期水平与某一固定时期水平之比计算的发展速度,它等于环比发展速度的连乘积。因此2006~2010年5年的定基发展速度等于该5年(环比增长速度+1)的连乘积,即(1+3%)×(1+2%)×(1+4%)×(1+6%)×(1+7%)。
二、多项选择题(在备选答案中有两个或更多选项是正确的。多选、少选均不得分。每小题2分,共10分。)
1.一组数据的直方图如右图。根据这个图形,以下说法正确的有( )。
A.这种分布是右偏分布
B.这种分布是左偏分布
C.根据这组数据计算的偏态系数大于零
D.根据这组数据计算的偏态系数小于零
E.这组数据的中位数小于其平均数
【答案】ACE
【解析】AB两项,从图中可以看出,数据分布右边的尾部比左边的尾部长,呈右偏分布。CD两项,测度偏态的统计量是偏态系数,偏态是对数据分布对称性的测度。当分布不对称时,若偏态系数为正,可判断为正偏或右偏;反之若为负,可判断为负偏或左偏。图中数据分布呈右偏,因此偏态系数为正。E项,如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则众数<中位数<平均数。
2.在估计总体比例的抽样调查中,计算必要样本容量时哪些方法可以用来估计总体方差( )。
A.根据试点调查的结果估计
B.根据历史资料估计
C.将总体方差假设为0.25
D.将总体比例假设为0.5
E.将总体方差假设为0.5
【答案】ABCD
【解析】在计算样本容量时,必须知道总体的方差。而在实际抽样调查前,往往总体的方差是未知的。在实际操作时,一般用如下办法解决:①利用预调查或试调查的结果估计;②利用过去的资料估计;③若曾有若干个方差,应选择最大的,以保证抽样估计的精确度。总体比例估计问题中常取P=0.5,σ2=P(1-P)=0.25。
3.随机变量概率分布的表示方式有( )。
A.概率分布图
B.概率分布函数式
C.回归函数式
D.概率分布表
E.方差分析表
【答案】ABD
【解析】随机变量的概率分布的表示方式有概率分布表、概率分布图和概率分布函数式三种。
4.在对单个样本均值的t检验(双侧检验)中,根据样本计算得到的t值等于3.57,己知在5%的显著性水平下临界值等于2.12,则以下说法正确的有( )。
A.根据t统计量的实际值和临界值应该拒绝零假设
B.根据t统计量的实际值和临界值不能拒绝零假设
C.在这一检验中如果计算相应的P值,则P值>0.05
D.在这一检验中如果计算相应的P值,则P值<0.05
E.根据现有数据无法得出结论
【答案】AD
【解析】双侧检验的目的是检验在原假设成立的条件下样本统计量观测值是否显著地高于或低于临界值。统计量观测值过高或过低说明在一次观察中小概率事件发生了,而这几乎是不可能的,因此在这种情况下拒绝原假设。AB两项,t统计量的实际值为3.57,大于其临界值2.12,拒绝原假设。CD两项,在5%的显著性水平下,双侧检验中当P>0.05时不能拒绝原假设,P<0.05时则拒绝原假设。因此该题中P值应小于0.05。
5.用普通最小平方法估计一元线性回归方程时,假设:ei=Yi-Y(∧)i=Yi-β0-β1Xi,则以下结论成立的有( )。
A.Σei2=0
B.Σei=0
C.Σei达到最小值
D.Σei2达到最小值
E.ΣeiXi=0
【答案】BDE
【解析】普通最小平方法又称最小二乘法,即为选择一条直线,使其残差平方和达到最小值的方法。即有选择β(∧)0,β(∧)1,使得:
达到最小值。令Q=∑(yi-y(∧)i)2,此时需满足:
即:Σei=0,ΣeiXi=0。
三、简答题(每小题8分,共32分)
1.分别说明分层抽样和整群抽样方式的组织方式和特点。
答:(1)组织方式:分层抽样是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽选一定单位构成样本。整群抽样是先将总体划分为若干群,再从中任意抽取几群,然后对抽中的群作全面调查。
(2)分层抽样特点:①分层抽样除了可以对总体进行估计外,还可以对各层子总体进行估计;②在一定条件下为组织实施调查提供了方便;③分层抽样抽取得到的样本单位具有较强的代表性,可以有效地提高估计的精度。
整群抽样特点:①在大规模抽样调查中,整群抽样大大简化了编制抽样框的工作量;②样本单位比较集中,容易集中力量进行调查,可以节省调查费用,方便调查的实施;③因为样本单位不能均匀地分布在总体各个部分,故样本的代表性较差。
2.什么是假设检验中的两类错误?他们之间有什么关系?
答:(1)假设检验中的两类错误是指在假设检验中,由于样本信息的局限性而产生的错误,包含以下两类:
①第I类错误也称为α错误或弃真错误,是指当原假设H0正确时,却拒绝H0的情况。
②第II类错误也称为β错误或取伪错误,是指原假设H0错误时,反而没有拒绝H0的情况。
(2)在假设检验中α和β存在此消彼长的关系。α+β不一定等于1,但在样本容量确定的情况下,α与β不能同时增加或减少。若要使α和β同时变小,只能增大样本量。
3.试述使用普通最小二乘法估计线性回归模型时需要的基本假设。
答:普通最小二乘法是使因变量的观察值yi与估计值y(∧)i之间的离差平方和达到最小来估计β0和β1的方法。为了对回归估计进行有效地解释,必须对随机扰动项µi和解释变量Xi进行科学的抽象即假定,这些假定称为线性回归模型的基本假定。主要有以下几个方面:
(1)因变量y与自变量x之间具有线性关系。
(2)在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。
(3)零均值假定:E(µi)=0(i=1,2,…,n)
随机扰动项µ可正可负,发生的概率大致相同。平均地看,这些随机扰动项有互相抵消的趋势。
(4)同方差假定:var(µi)=E[µi-E(µi)]2=E(µi2)=σ2(i=1,2,…,n)
这个假定表明,对每个Xi,随机扰动项µi的方差等于一个常数σ2。
(5)误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)
(6)解释变量与扰动项不相关假定:cov(Xi,µi)=0
(7)解释变量之间不是完全线性相关的,称无完全多重共线性。
4.试述加法模型中季节成分的分析方法。
答:季节变动是一种比较常见的经济和社会现象,在经济分析中需要进行季节调整来避免对其他因素的干扰。加法模型是常见的时间序列模型之一,其假定季节因素对一个时间序列影响的绝对值不变,即模型Y=T+C+I+S中,S对Y影响的绝对值不变。其中,T为长期趋势要素,C为循环要素,I为不规则要素。计算加法模型中季节成分的方法如下:
(1)先测定出时间序列的长期趋势成分,将原时间序列各观测值减去相应的长期趋势值,得到剔除长期趋势后的时间序列。
(2)计算剔除长期趋势后的时间序列的同期(同月或同季度)平均值,得到未调整的季节成分。
(3)用未调整的季节指数减去剔除长期趋势后的时间序列的总平均值,得到调整后的季节成分。
四、计算与分析题(共78分)
1.(13分)某企业2013年3月1日对15名员工的调查表明,他们从居住地到达工作地点花费的时间如下(分钟):10,55,70,25,30,45,30,50,25,40,55,90,40,60,70。
(1)计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平?为什么?(4分)
(2)根据以上数据给出数据的茎叶图。(3分)
(3)绘制以上数据的简单箱线图。(3分)
(4)根据以上计算和图形分析数据分布的特征。(3分)
答:(1)对数据进行排序:10,25,25,30,30,40,40,45,50,55,55,60,70,70,90
均值:
中位数:
因此为第8个数值,Me=45(分钟)。
众数Mo=25,30,40,55,70(分钟)。
其中均值最能反映这组数据的一般水平,因为均值是集中趋势的最主要测度值,且该组数据中不存在明显极端值,均值能较准确地反映这组数据的一般水平。
(2)茎叶图如下:
(3)题目数据中,最大值=90,最小值=10,中位数=45
下四分位数QL的位置=15/4=3.75,因此QL=25+0.75×(30-25)=28.75;
上四分位数QU的位置=15×(3/4)=11.25,因此QU=55+0.25×(60-55)=56.25;
(4)从(1)中计算可知,均值大于中位数;从(2)中茎叶图可以看出数据分布不对称;从(3)中箱线图可以看出数据呈右偏分布,从箱子的长度可以看出,此样本的数据分布比较分散。
2.(15分)为研究儿童看电视的习惯,社会学家从10000名儿童中无放回地随机抽取n=50个儿童作为样本,得到每周看电视的平均时间为12.5小时,样本标准差为2.2小时;样本中男孩为27名。
(1)估计儿童每周平均看电视时间的95%的置信区间。(4分)
(2)估计总体中男孩人数的95%的置信区间。(4分)
(3)在(1)中,若总体人数为500人,其他条件不变,相应的置信区间是多少?(4分)
(4)在(1)中,若每周平均看电视时间的允许误差(即抽样极限误差)缩小为原来的一半,应抽取多少儿童作为样本?(3分)
已知:Z0.025=1.96。
答:(1)已知n=50,N=10000,`x=12.5,ε=2.2,置信水平1-α=95%,则zα/2=1.96。由于总体方差未知,但为大样本,可用样本方差代替总体方差,且`x近似服从z分布。则在不重复抽样情况下儿童每周平均看电视时间的95%的置信区间为:
即儿童每周平均看电视时间的95%的置信区间为:11.89小时~13.11小时。
(2)已知n=50,1-α=95%,根据抽样结果计算的男孩人数的样本比例为:p=27/50=54%。用样本比例p来代替总体比例π,则总体比例的置信区间可表示为:
故总体中男孩人数的95%的置信区间为:(40.22%×10000,67.78%×10000),即4022名~6778名。
(3)其他条件不变,当N=500时,相应的置信区间为:
即此时儿童每周平均看电视时间的95%的置信区间为:11.92小时~13.08小时。
(4)记允许误差为d,不重复抽样情况下有
当N=10000时,,故样本量可近似为:,总体方差未知,用样本方差代替,即为:。所以若d缩小为原来的一半,则n应扩大为原来的4倍,即应抽取50×4=200个儿童作为样本。
3.(16分)某商场准备在商场内安装充电式应急照明灯,通过招标收到3家照明灯生产商的投标。该商场对3个生产商产品中进行抽样检验,以最终确定供应商。各个样品充电后可持续照明的时间长度(小时)数据和部分计算结果如下表。
(1)根据以上数据进行方差分析,写出方差分析的原假设、备择假设。(2分)
(2)根据方差分析的原理计算F统计量的值。计算过程和结果一律保留2位小数。(5分)
(3)己知F检验中统计量的临界值为3.5,检验的结论如何?(3分)
(4)分析人员认为根据初步的分析结果就可以淘汰厂商B,他的依据是什么?(2分)
(5)如果只比较生产商A和C的均值是否相等,可以用什么检验方法?说明这种方法的基本步骤。(4分)
答:(1)原假设H0:µA=µB=µC;备择假设H1:µA,µB,µC不全相等。
(2)由已知可得:`y=∑yi/15=9.70,又已知:`yA=9.80,`yB=9.30,`yC=10.00;s1=0.35,s2=0.40,s3=0.39,则有:
SSA=5×(9.80-9.70)2+5×(9.30-9.70)2+5×(10.00-9.70)2=1.3
SSE=SSEA+SSEB+SSEC=(5-1)×s12+(5-1)×s22+(5-1)×s32=4×(0.352+0.402+0.392)≈1.74
SST=SSA+SSE=1.3+1.74=3.04
因此F=MSA/MSE=SSA/(k-1)÷SSE/(n-k)=1.30/2÷1.74/12=4.48,其中k为生产商个数,n为所有观测值个数。
(3)由于F=4.48>Fα=3.5,因此拒绝原假设,认为3种照明灯的平均持续照明时间是有差异的。
(4)由于厂商B抽样检验中的样品平均可持续照明的时间是最短的,且样本标准差最大,即其产品的性能最不稳定,因此结合这两个因素便可以淘汰厂商B。
(5)在小样本且总体方差未知的情况下,对两个总体的均值进行比较可以采用t检验。基本步骤为:
①提出原假设和备择假设:H0:μA-μC=0;H1:μA-μC≠0。
②对两个总体的方差作F检验,检验它们是否相等,根据检验结果选择相对应的t检验统计量。
③代入样本数据计算检验统计量的数值,并确定其自由度。
④进行统计决策。看计算出的t值是否落入拒绝域,若|t|>|tα/2|则拒绝H0,否则不能拒绝H0。
4.(15分)某市居民的货币收入和购买消费品支出资料如下:
根据上述资料:
(1)计算货币收入与购买消费品支出的相关系数。(3分)
(2)说明用普通最小二乘法估计回归系数的基本原理。(3分)
(3)计算根据货币收入预测消费支出的线性回归方程,说明回归系数的含义。(4分)
(4)计算回归方程的决定系数(判定系数)。(2分)
(5)当货币收入达到30亿元时,预测消费品支出额的估计值。(3分)
答:(1)记货币收入为x,消费支出为y,n为观测个数。
二者相关系数:
代入样本数据得到:∑x=126,∑y=95,∑xy=1885,∑x2=2518,∑y2=1415,则:
(2)OLS基本原理:用各个离差的平方和:
最小来保证所拟合方程的总误差很小。解方程组:
整理得
解出回归系数估计量β(∧)0,β(∧)1。
(3)由(2)
则
则货币收入对消费支出的预测方程为y(∧)=0.97+0.7x。回归系数β(∧)1=0.7表示货币收入每增加1亿元,消费支出平均增加0.7亿元;β(∧)0在数学意义上来说表示当货币收入为0时消费支出为0.97亿元,但经济意义上没有实际意义。
(4)在一元线性回归方程中,判定系数等于x和y相关系数的平方,即:R2=r2=0.9872=0.974。
(5)当x=30时,y(∧)=0.97+0.7×30=21.97(亿元)。即此时消费品支出额的估计值为21.97亿元。
5.(9分)某手机企业从甲乙丙三个供应商处共采购了10万件触控屏(采购量分别为5万件、3万件和2万件)。己知甲乙丙三家供应商的次品率分别为3%、4%和5%。
(1)从产品中随机抽取一件为次品的概率。(3分)
(2)10万件产品中次品数的期望值。(3分)
(3)随机抽取一件为次品,该产品来自丙供应商的概率。(3分)
答:设事件A1,A2,A3分别表示抽取的样品分别来自甲乙丙三家供应商,事件B表示从产品中随机抽取一件为次品;用x1,x2,x3分别表示来自甲乙丙三家供应商的采购量。
(1)P(B)=P(B|A1)P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)=0.03×5/10+0.04×3/10+0.05×2/10=0.037
(2)
(3)已知抽取到的产品为次品,则它来自丙供应商的概率为:
6.(10分)某学校的班车在路上所花的时间服从正态分布,且均值为40分钟,标准差为5分钟。班车每天7:10时出发,要求8:00之前到达另外一个校区。已知标准正态分布表:
①Φ(1)=0.8413,②Φ(2)=0.9772。请计算:
(1)班车迟到的概率。(5分)
(2)该班车10月份共发车16次,计算该班车10月份从不迟到的概率。(5分)
答:(1)记X为班车在路上所花的时间,已知X~N(40,52),则
(2)由(1),该班车不迟到的概率为1-0.0228=0.9772。10月份共发车16次,则10月份从不迟到的概率为0.977216=0.6914。