模块六 试验的方差分析
学习目标
1.理解方差分析的基本原理。
2.掌握方差分析的基本方法和多重比较方法。
3.领会方差分析的基本模型。
4.掌握正确进行单因素、双因素方差分析的方法。
任务描述
1.通过学习方差分析的线性模型、平方和与自由度的划分、F分布与检验、多重比较,熟练掌握方差分析的计算步骤及方差分析表。
2.通过学习单因素试验的方差分析,熟练掌握处理相等和不等的单因素方差分析的计算步骤及方差分析表。
3.通过学习双因素试验的方差分析,熟练掌握双因素试验的等重复及无重复的方差分析的计算步骤及方差分析表。
项目一 方差分析的概述
t检验法适用于样本平均数、总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需要进行多个平均数间的差异显著性检验,这时不适宜采用t检验法,原因如下所述。
(1)检验过程烦琐 例如,一个试验包含5个处理,采用t检验法要进行=10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。因此,整个检验过程非常复杂,烦琐。
(2)无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差估计值。若用t检验法作两两比较,由于每次比较需计算一个,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有5个处理,每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2 ×(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5 ×(6-1)=25。可见,在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。
(3)推断的可靠性低,检验的错误率大 即使利用资料所提供的全部信息估计了试验误差,若用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大错误的概率,降低推断的可靠性。
由于上述原因,多个平均数的差异显著性检验不宜采用t检验,须采用方差分析法。
方差分析(analysis of variance)是由英国统计学家费雪(R. A. Fisher)于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方及自由度分解为相应的不同变异来源的平方及自由度,进而获得不同变异来源的总体方差的估计值。通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。
方差分析有很多类型,其数学模型的具体表达式也有所不同,但以下三点却是共同的,是进行方差分析的基本前提或基本假定。
(1)效应的可加性 进行方差分析的模型均为线性可加模型。这个模型明确提出了处理效应与误差效应是“可加的”,正是由于这一“可加性”,才有了样本平方和的“可加性”,亦即有了试验观测值总平方和的“可剖分”性。如果试验资料不具备这一性质,那么依据变异原因去剖分变量的总变异将失去根据,方差分析不能正确进行。
(2)分布的正态性 是指所有试验误差是相互独立的,且都服从正态分布N(0,σ2)。只有在这样的条件下才能进行F检验。
(3)方差的同质性 即各个处理观测值总体方差σ2应是相等的。只有这样,才有理由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。
一、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。
表6-1 k个处理每个处理有n个观测值的数据模式
其中xij表示第i个处理的第j个观测值(i=1,2,…,k;j=1,2,…,n);表示第i个处理n个观测值的和;表示全部观测值的总和;表示第i个处理的平均数;=x··/n表示全部观测值的总平均数;xij可以分解为
μi表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将μi再进行分解,令
则
其中μ表示全试验观测值总体的平均数,αi是第i个处理的效应(treatment effects),表示处理i对试验结果产生的影响,显然有
εij是试验误差,相互独立,且服从正态分布N(0,σ2)。
式6-4为单因素试验的线性模型(linear model),亦称数学模型。在这个模型中,xij表示总平均数μ、处理效应αi和试验误差εij之和。由于εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数μi可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其他类型方差分析的前提或基本假定。
若将表6-1中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则
与式6-4比较可知,=eij分别是μ、(μi-μ)=αi、(xij-μi)=εij的估计值。
式6-4、式6-6表明:每个观测值都包含处理效应(μi-μ或),与误差(xij-μi或xij-x-i·),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。
二、平方和与自由度的剖分
方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点,而且不用开方,所以在方差分析中是用样本方差即均方(mean squares)来度量资料的变异程度。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子——称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母——称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。
1.总平方和的剖分
如表6-1所示,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST,即
因为
其中=0
所以
式6-8中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,
即
式6-8中,为各处理内离均差平方和之和,反映了各处理内的变异误差,称为处理内平方和或误差平方和,记为SSe,即
于是有
式6-8、式6-11是单因素试验结果总平方和、处理间平方和、处理内平方和的关系式。这个关系式中三种平方和的简便计算公式为
其中,称为矫正数。
2.总自由度的剖分
在平方和计算公式中可以看出,在同样误差程度下,试验数据越多,计算出的平方和越大,因此仅用平方和来反映试验值之间差异的大小还是不够的,还需要试验次数的多少对平方和带来的影响,维持需要考虑自由度(degree of free-dom)。三种平方和对应的自由度分别如下:
SST的自由度称为总自由度,即
SSt的自由度称为处理间自由度,即
SSe的自由度称为处理内自由度,即
因为
nk-1=(k-1)+(nk-k)=(k-1)+k(n-1)
所以
综合以上各式得
各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为(MST或)、MSt(或)和MSe(或),即
总均方一般不等于处理间均方加处理内均方。
【例6-1】某高校畜牧实验室为了比较四种不同配合饲料对鸡的饲喂效果,选取了条件基本相同的20只,随机分成四组,投喂不同饲料,经一个月试验以后,各组鸡的增重结果如表6-2所示。
表6-2 饲喂不同饲料的鸡的增重 单位:g
这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下。
矫正数
总平方和
处理间平方和
处理内平方和
SSe=SST-SSt=19966.8-11426.8=8540
总自由度
dfT=nk-1=5×4-1=19
处理间自由度
dft=k-1=4-1=3
处理内自由度
dfe=dfT-dft=19-3=16
用SSt、SSe分别除以dft和dfe得到处理间均方MSt及处理内均方MSe,即
因为方差分析中不涉及总均方的数值,所以不必计算。
三、F分布与F检验
1.F分布
设想作这样的抽样试验,即在一正态总体N(μ,σ2)中随机抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由式6-22至式6-24算出的和都是误差方差σ2的估计量。以为分母,为分子,求其比值。统计学上把两个均方之比值称为F值,即
F值具有两个自由度:df1=dft=k-1,df2=dfe=k(n-1)。
若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布(Fdistribution)。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。
图6-1 F分布密度曲线
F分布的取值范围是(0,+∞),其平均值μF=1。
用f(F)表示F分布的概率密度函数,则其分布函数F(Fa)为
因而,F分布右尾从Fa到+∞的概率为
附表4列出的是不同df1和df2下,P(F ≥Fa)=0.05和P(F ≥Fa)=0.01时的F值,即右尾概率α=0.05和α=0.01时的临界F值,一般记作,。当df1=3,df2=18时,查附表4可知,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3.16的仅为5%,而大于5.09的仅为1%。
2.F检验
附录4是专门为检验代表的总体方差是否比代表的总体方差大而设计的。若实际计算的F值大于,则F值在α=0.05的水平上显著,以95%的可靠性(即冒5%的风险)推断代表的总体方差大于代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。
在方差分析中进行F检验的目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。
在单因素试验结果的方差分析中,无效假设为H0:μ1=μ2=…=μk,备择假设为HA:各μi不全相等,或=0,≠0;F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。反过来理解:如果H0是正确的,那么MSt与MSe都是总体误差σ2的估计值,理论上讲F值等于1;如果H0是不正确的,那么MSt之期望均方中的就不等于零,F值就必大于1。但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。所以,只有F值达到一定程度时,才有理由否定H0。
实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附录4所得的临界F值,相比较做出统计推断的。
若,即P>0.05,不能否定H0,统计学上把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;若,即0.01<P≤0.05,否定H0,接受HA,统计学上把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F≥,即P≤0.01,否定H0,接受HA,统计学上把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“**”。
对于【例6-1】,因为F=MSt/MSe=38.09/5.34=7.13**;根据df1=dft=3,df2=dfe=16,查附表4,得F>F0.01(3,16)=5.29,P<0.01,表明四种不同饲料对鸡的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。
在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,如表6-3所示。
表6-3 资料方差分析表
表中的F值应与相应的被检验因素齐行。因为经F检验差异极显著,故在F值7.13右上方标记“**”。
在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F值检验可在方差分析表上进行。
项目二 多重比较
F值显著或极显著,否定了无效假设H0,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异是否显著。统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。多重比较的方法有很多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。
一、最小显著差数法
最小显著差数法简称LSD法(least significant difference),该方法的基本原理是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其进行比较。若>LSDa,则与在α水平上差异显著;反之,在α水平上差异不显著。最小显著差数计算公式如下:
式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差异标准误,计算公式如下:
其中,MSe为F检验中的误差均方,n为各处理的重复数。
当显著水平α=0.05和0.01时,从t值表中查出和,代入式6-28得公式如下:
利用LSD法进行多重比较时,可按如下步骤进行。
(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列。
(2)计算最小显著差数LSD0.05和LSD0.01。
(3)将平均数多重比较表中两两平均数的差数与LSD0.05、LSD0.01比较,做出统计推断。
对于【例6-1】,各处理的多重比较如表6-4所示。
表6-4 四种饲料平均增重的多重比较表(LSD法)
注:表中A4与A3的差数为3.22,用q检验法时,在α=0.05的水平上不显著。
因为,=1.462;查t值表得:=t0.05(16)=2.120,=t0.01(16)=2.921。
所以,显著水平为0.05与0.01的最小显著差数:
将表6-4中的6个差数与LSD0.05,LSD0.05比较:小于LSD0.05者不显著,在差数的右上方标记“ns”,或不标记符号;介于LSD0.05与LSD0.01之间者显著,在差数的右上方标记“*”;大于LSD0.01者极显著,在差数的右上方标记“**”。检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鸡的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鸡的增重效果极显著高于A3饲料;A4与A2、A2与A3的增重效果差异不显著,以A1饲料对鸡的增重效果最佳。
二、最小显著极差法
简称LSR法(Least significant ranges),LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSR法的不足。这些在显著水平α上,依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差LSR。例如,有10个要相互比较,先将10个依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距k=10时的最小显著极差决定(≥为显著,<为不显著;而后是秩次距k=9的平均数的极差的显著性,则由极差是否大于k=9时的最小显著极差决定;直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。因此,有k个平均数相互比较,就有k-1种秩次距(k,k-1,k-2,…,2),因而需求得k-1个最小显著极差(LSRα,k),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。
LSR法克服了LSR法的不足,但检验的工作量有所增加。常用的LSR法有q检验法和新复极差法两种。
1.q检验法(qtest)
此法是以统计量q的概率分布为基础的。q值由下式求得
式中,ω为极差,为标准误,q分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将由式6-31算出的q值与临界q值比较,而是将极差与比较,从而做出统计推断。即为α水平上的最小显著极差。
当显著水平α=0.05和0.01时,从附表7(q值表)中根据自由度dfe及秩次距k查出和代入式6-33得
实际利用q检验法进行多重比较时,可按如下步骤进行。
(1)列出平均数多重比较表。
(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k。
(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,做出统计推断。
对于【例6-1】,各处理平均数多重比较如表6-4所示。其中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。
因为,MSe=5.34,故标准误为
根据dfe=16,k=2,3,4由附表7查出α=0.05、0.01水平下临界q值,乘以标准误求得各最小显著极差,所得结果如表6-5所示。
表6-5 q值及LSR值
将表6-4中的极差1.54、1.68、3.22与表6-5中的最小显著极差3.099、4.266比较;将极差3.22、4.90与3.770、4.948比较;将极差6.44与4.184、5.361比较。检验结果,除A4与A3的差数3.22由LSD法比较时的差异显著变为差异不显著外,其余检验结果同LSD法。
2.新复极差法(new multiple range method)
此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。
新复极差法与q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附录8)而不是查q值表。最小显著极差计算公式为
其中是根据显著水平α、误差自由度dfe、秩次距k,由SSR表查得的临界SSR值,。α=0.05和α=0.01水平下的最小显著极差为
对于【例6-1】,已算出=1.033,依dfe=16,k=2,3,4,由附录8查临界SSR0.05(16,k)和SSR0.01(16,k)值,乘以=1.033,求得各最小显著极差,所得结果如表6-6所示。
表6-6 SSR值与LSR值
将表6-4中的平均数差数(极差)与表6-6中的最小显著极差比较,检验结果与q检验法相同。
当各处理重复数不等时,为了简便起见,不论LSD法还是LSR法,可如式6-36所示计算出一个各处理平均的重复数n0,以代替计算或所需的n。
式中 k为试验的处理数,ni(i=1,2,…,k)为第i处理的重复数。
以上介绍的三种多重比较方法,其检验尺度有如下关系:
LSD法≤新复极差法≤q检验法
当秩次距k=2时,取等号;秩次距k≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。根据上述排列顺序,前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。一个试验资料究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。如果否定正确的H0是事关重大或后果严重的,或对试验要求严格时,用q检验法较为妥当;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。生物试验中,由于试验误差较大,常采用新复极差法;F检验显著后,为了简便,也可采用LSD法。
三、多重比较结果的表示法
各平均数经多重比较后,应以简明的形式将结果表示出来,常用的有以下两种方式。
1.三角形法
此法是将多重比较结果直接标记在平均数多重比较表上,如表6-4所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。
2.标记字母法
此法是先将各处理平均数由大到小、自上而下排列,然后在最大平均数后标记字母a,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母a,直到某一个与其差异显著的平均数标记字母b;再以标有字母b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标b,直至显著为止;再以标记有字母b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c,……如此重复下去,直至最小一个平均数被标记比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平α=0.05,用大写拉丁字母表示显著水平α=0.01。在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。
对于【例6-1】,现根据表6-4所表示的多重比较结果用字母标记如表6-7所示(用新复极差法检验,表6-4中A4与A3的差数3.22在α=0.05的水平上不显著,其余的与LSD法同)。
表6-7 多重比较结果的字母标记(SSR法)
在表6-7中,先将各处理平均数由大到小、自上而下排列。当显著水平α=0.05时,先在平均数31.18行上标记字母a;由于31.18与27.96之差为3.22,在α=0.05水平上显著,所以在平均数27.96行上标记字母b;然后以标记字母b的平均数27.96与其下方的平均数26.28比较,差数为1.68,在α=0.05水平上不显著,所以在平均数26.28行上标记字母b;再将平均数27.96与平均数24.74比较,差数为3.22,在α=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在α=0.01将各处理平均数标记上字母,结果如表6-7所示。q检验结果与SSR法检验结果相同。
由表6-7可以发现,A1饲料对鸡的平均增重极显著地高于A2和A3饲料,显著高于A4饲料;A4、A2、A3三种饲料对鸡的平均增重差异不显著。四种饲料其中以A1饲料对鸡的增重效果最好。
应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。
四、方差分析的基本步骤
根据任务一和任务二的介绍,方差分析的基本步骤现归纳如下所述。
(1)计算各项平方和与自由度。
(2)列出方差分析表,进行F检验。
(3)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。
项目三 单因素试验的方差分析
一、单因素试验介绍
在试验中,将要考查的指标称为试验指标,影响试验指标的条件称为因素。因素可分为两类,一类是人们可以控制的;一类是人们不能控制的。例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的。以下所说的因素都是可控因素,因素所处的状态称为该因素的水平。在方差分析中,根据所研究试验因素的多少,可分为单因素、双因素和多因素试验资料的方差分析。单因素试验资料的方差分析是其中最简单的一种,目的在于正确判断该试验因素各水平的优劣。根据各处理内重复数是否相等,单因素方差分析又分为重复数相等和重复数不等两种情况。
二、各处理重复数相等的方差分析
【例6-2】抽测5个不同品种的若干头母猪的窝产仔数,结果如表6-8所示,试检验不同品种母猪平均窝产仔数的差异是否显著。
表6-8 五个不同品种母猪的窝产仔数
这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下所述。
(1)计算各项平方和与自由度
(2)列出方差分析表,进行F检验,如表6-9所示。
表6-9 不同品种母猪的窝产仔数的方差分析表
根据df1=dft=4,df2=dfe=20查临界F值得:F0.05(4,20)=2.87,F0.01(4,20)=4.43,因为F>F0.01(4,20),即P<0.01,表明品种间产仔数的差异极显著。
(3)多重比较 采用新复极差法,各处理平均数多重比较,如表6-10所示。
表6-10 不同品种母猪的平均窝产仔数多重比较表(SSR法)
因为MSe=3.14,n=5,所以为
根据dfe=20,秩次距k=2,3,4,5,由附录8查出α=0.05和α=0.01的各临界SSR值,乘以=0.7925,即得各最小显著极差,所得结果如表6-11所示。
表6-11 SSR值及LSR值
将表6-10中的差数与表6-11中相应的最小显著极差比较,结果表明:5号品种母猪的平均窝产仔数极显著高于2号品种母猪,显著高于4号和1号品种,但与3号品种差异不显著;3号品种母猪的平均窝产仔数极显著高于2号品种,与1号和4号品种差异不显著;1号、4号、2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以5号品种母猪的窝产仔数最高,3号品种次之,2号品种母猪的窝产仔数最低。
三、各处理重复数不等的方差分析
在各处理重复数不等的情况下,方差分析步骤与各处理重复数相等的情况相同,只是在有关计算公式上略有差异。
设处理数为k;各处理重复数为n1,n2,…,nk;试验观测值总数为N=∑ni,则
【例6-3】5个不同品种牛的育肥试验,后期15d增重质量(kg),如表6-12所示。试比较品种间增重有无差异。
表6-12 5个品种牛30d增重质量
此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下:
(1)计算各项平方和与自由度
利用式(6-37)计算得
(2)列出方差分析表,进行F检验 临界F值为:F0.05(4,20)=2.87,F0.01(4,20)=4.43,因为品种间的F值5.99>F0.01(4,20),P<0.01,表明品种间差异极显著,如表6-13所示。
表6-13 5个品种育肥牛增重方差分析表
(3)进行多重比较 采用新复极差法,各处理平均数多重比较,如表6-14所示。因为各处理重复数不等,应先由式(6-37)计算出平均重复次数n0来代替标准误中的n,此例
于是,标准误
表6-14 5个品种育肥牛平均增重多重比较表(SSR法)
根据dfe=20,秩次距k=2,3,4,5,从附表8中查出α=0.05与α=0.01的临界SSR值,乘以=0.63,即得各最小显极差,所得结果如表6-15所示。
表6-15 SSR值及LSR值表
将表6-14中的各个差数与表6-15中相应的最小显著极差比较,多重比较结果表明,B1、B4品种的平均增重极显著或显著高于B2、B5品种的平均增重,其余不同品种之间差异不显著。可以认为B1、B4品种增重最快,B2、B5品种增重较差,B3品种居中。
单因素试验只能解决一个因素各水平之间的比较问题。如上述研究几个品种牛的育肥试验,只能比较几个品种的增重快慢。而影响增重的其他因素,如饲料中能量的高低、蛋白质含量的多少、饲喂方式及环境温度的变化等就无法得以研究。实际上,往往对这些因素有必要同时考查,只有这样才能做出更加符合客观实际的科学结论,才有更大的应用价值。这就要求进行双因素或多因素试验。下面介绍双因素试验资料的方差分析法。
项目四 双因素试验的方差分析
一、双因素试验概述
在许多实际问题中,往往要同时考虑两个因素对试验指标的影响。例如,进行某一项试验,当影响指标的因素不是一个而是多个时,要分析各因素的作用是否显著,就要用到多因素的方差分析。当有两个因素时,除每个因素的影响之外,还有这两个因素的搭配问题。如图6-2中的两组试验结果,都有两个因素A和B,每个因素取两个水平。
图6-2
图6-2(1)中,无论B在什么水平(B1还是B2),水平A2下的结果总比A1下的高20;同样地,无论A是什么水平,B2下的结果总比B1下的高40。这说明A和B单独地各自影响结果,互相之间没有作用。
图6-2(2)中,当B为B1时,A2下的结果比A1的高,而且当B为B2时,A1下的结果比A2的高;类似地,当A为A1时,B2下的结果比B1的高70,而A为A2时,B2下的结果比B1的高30。这表明A的作用与B所取的水平有关,而B的作用也与A所取的水平有关。即A和B不仅各自对结果有影响,而且它们的搭配方式也有影响。把这种影响称作因素A和B的交互作用,记作A×B在双因素试验的方差分析中,不仅要检验水平A和B的作用,还要检验它们的交互作用。
二、等重复的双因素试验方差分析
设有两个因素A,B作用于试验的指标,因素A有r个水平A1,A2,…,Ar,因素B有s个水平B1,B2,…,Bs,现对因素A,B的水平的每对组合(Ai,Bj),i=1,2,…,r;j=1,2,…,s都作t(t≥2)次试验(称为等重复试验),得到如表6-16的结果。
表6-16 等重复的双因素试验
设xijk~N(μij,σ2),i=1,2,…,r;j=1,2,…,s;k=1,2,…,t,各xijk独立,这里μij,σ2均为未知参数,或写为
记
于是
称μ为总平均,αi为水平Ai的效应,βj为水平Bj的效应,γij为水平Ai和水平Bj的交互效应,这是由Ai,Bj搭配起来联合作用而引起的。可知
这样式6-40可写成
其中μ,αi,βj,γi j及σ2都为未知参数。
式6-42就是所要研究的双因素试验方差分析的数学模型。要检验因素A,B及交互作用A×B是否显著,要检验以下3个假设:
类似于单因素情况,对这些问题的检验方法也是建立在平方和分解上的。记作
不难验证,,,分别是μ,μi·,μ·j,μij的无偏估计。
由,1≤i≤r,1≤j≤s,1≤k≤t,得平方和的分解式,如式6-43所示。
其中
SE称为误差平方和,SA,SB分别称为因素A,B的效应平方和,SA×B称为A,B交互效应平方和。
当H01:α1=α2=…=αr=0为真时,
当假设H02为真时,
当假设H03为真时,
当给定显著性水平α后,假设H01,H02,H03的拒绝域分别为
经过上面的分析和计算,可得出双因素试验的方差分析,如表6-17所示。
表6-17 双因素试验的方差分析表
在实际中,与单因素方差分析类似,可按以下较简便的公式来计算ST,SA,SB,SA×B,SE。
记
即有
【例6-4】为探讨某食品化学反应中温度和催化剂对收率的影响,实验员选了三种温度(A)和三种不同的催化剂(B),观察数据如表6-18所示。试在显著水平0.10下分析不同的温度(A),催化剂(B)以及它们的交互作用(A×B)对收率有无显著影响。
表6-18 温度和催化剂对收率的影响
根据题意,需检验假设H01,H02,H03。r=s=3,t=2,T···,Tij·,Ti··,T·j·的计算如表6-19所示。
表6-19 【例6-4】的计算结果
得方差分析表如6-20所示。
表6-20 例6-4的方差分析表
由于F0.10(2,9)=3.01>FA,F0.10(2,9)>FB,F0.10(4,9)=2.69>FA×B,因而接受假设H01,H02,H03,即温度、催化剂以及它们的交互作用对化学反应的收率的影响不显著。
三、无重复的双因素试验方差分析
在双因素试验中,如果对每一对水平的组合(Ai,Bj)只做一次试验,即不重复试验,所得结果如表6-21所示。
表6-21 无重复双因素试验
这时=xijk,SE=0,SE的自由度为0,故不能利用双因素等重复试验中的公式进行方差分析。但如果认为A,B两因素无交互作用,或已知交互作用对试验指标影响很小,则可将SA×B取作SE,仍可利用等重复的双因素试验对因素A,B进行方差分析。对这种情况下的数学模型及统计分析表示如下所示。
由式6-42可得到,
要检验的假设有以下两个:
记
平方和分解公式为
其中
分别为总平方和、因素A,B的效应平方和及误差平方和。
取显著性水平为α,当H01成立时,
H01拒绝域为
当H02成立时
H02拒绝域为
得方差分析如表6-22所示。
表6-22 无重复双因素试验方差分析表
【例6-5】测试品牌白酒在不同酒精含量和各种温度下的挥发值,表6-23列出了试验的数据,问试验温度、酒精含量对白酒的挥发值的影响是否显著?(α=0.01)
表6-23 品牌白酒在不同酒精含量和各种温度下的挥发试验
解:已知r=4,s=3,需检验假设H01,H02,经计算得方差分析如表6-24所示。
表6-24 例6-5的方差分析表
由于F0.01(3,6)=9.78<FA,拒绝H01。F0.01(2,6)=10.92<FB,拒绝H02。检验结果表明,试验温度、酒精含量对白酒的挥发值影响是显著的。
练习题
1.多个处理平均数间的相互比较为什么不宜用t检验法?
2.什么是方差分析?方差分析在科学研究中有何意义?
3.单因素和双因素试验资料方差分析的数学模型有何区别?方差分析的基本假定是什么?
4.进行方差分析有哪些基本步骤?
5.什么叫多重比较?多个平均数相互比较时,LSD法与一般t检验法相比有何优点?还存在什么问题?如何决定选用哪种多重比较法?
6.在同样饲养管理条件下,三个品种羊的增重如下表,试对三个品种增重差异是否显著进行检验。
三个品种羊增重情况表 单位:kg
(MSe=8.57,F=6.42)
7.用三种酸类处理某牧草种子,观察其对牧草幼苗生长的影响(指标:幼苗干重,单位:mg),试验资料如表所示。
不同酸类对幼苗干重影响 单位:mg
(1)进行方差分析(不用LSD法、LSR进行多重比较,F=33.86**)。
(2)对下列问题通过单一自由度正交比较给以回答。
①酸液处理是否能降低牧草幼苗生长?
②有机酸的作用是否不同于无机酸?
③两种有机酸的作用是否有差异?
(F1=86.22**,F2=13.13**,F3=2.26)
8.为了比较4种饲料(A)和猪的3个品种(B),从每个品种随机抽取4头猪(共12头)分别喂以4种不同饲料。随机配置,分栏饲养、位置随机排列。从60日龄起到90日龄的时期内分别测出每头猪的日增重(g),数据如表所示,试检验饲料及品种间的差异显著性。(FA=11.13,FB=13.21,MSe=202.0833)。
4种饲料3个品种猪60~90日龄日增重 单位:g
9.研究酵解作用对血糖浓度的影响,从8名健康人体中抽取血液并制备成血滤液。每个受试者的血滤液又可分成4份,然后随机地将4份血滤液分别放置0min、45min、90min、135min测定其血糖浓度,资料如下表所示。试检验不同受试者和放置不同时间的血糖浓度有无显著差异。
不同受试者、放置不同时间血滤液的血糖浓度 单位:mg/100mL
(F=78.6**,F=28.8**)
10.为了从3种不同原料和3种不同温度中选择使酒精产量最高的水平组合,设计了两因素试验,每一水平组合重复4次,结果如下表所示,试进行方差分析。
用不同原料及不同温度发酵的酒精产量
(FA=12.68**,FB=24.88**,FA×B=2.77*,MSe=67.19)
11.用生长素处理豌豆,共6个处理。豌豆种子发芽后,移植24株,分成4组,每组6个木箱,每箱1株1个处理。试验共有4组24箱,试验时按组排列于温室中,使同组各箱的环境条件一致。然后记录各箱见第一朵花时4株豌豆的总节间数,其结果如下表所示。