第四节 正交实验设计
正交实验设计(Orthogonal experimental design)是利用“正交表”科学地安排与分析多因素多水平实验的方法。其特点为:完成实验要求所需的实验次数少;数据点的分布很均匀。可用相应的极差分析方法、方差分析方法、回归分析方法等对实验结果进行分析,得出许多有价值的结论。
正交实验是根据正交性从全面实验中挑选出部分有代表性的点进行实验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,是一种高效率、快速、经济的实验设计方法。例如一个三因素三水平的混凝实验,因素水平表如表1-2所示。
表1-2 混凝实验因素水平表
对此实验该如何进行实验方案的设计呢?很容易想到的是全面搭配法方案(如图1-1所示)。
图1-1 全面搭配法方案
此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数越多,则实验次数就越多,例如,做一个6因素3水平的实验,就需36=729次实验,显然难以做到。若按L9(3)4正交表安排实验,只需做9次,按L18(3)7正交表进行18次实验,显然大大减少了工作量。
正交实验设计方法是用正交表来安排实验的。对于上述混凝实验适用的正交表是L9(34),其实验方案表见表1-3。
表1-3 混凝实验方案表[L9(34)]
注:这个是4因素3水平表,对于混凝实验来说,只有3因素,借用了L9(34)表,针对有4因素的实验,需要有第4列(因素4)。
所有的正交表与L9(34)正交表一样,都具有以下两个特点:
(1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有3个水平,水平1、2、3都是各出现3次;
(2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。
这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的实验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数越多,运用正交实验设计方法,越发能显示出它的优越性,如上述提到的6因素3水平实验,用全面搭配方案需729次,若用正交表L27(313)来安排,则只需做27次实验。
1.正交表
正交表是一整套规则的设计表格,用LN(qS)表示。L为正交表的代号,N为实验的次数,q为水平数,S为列数,也就是可能安排最多的因素个数。正交表分为单一水平正交表和混合型正交表。
(1)各列水平数均相同的正交表。各列水平数均相同的正交表,也称单一水平正交表。例如L9(34)(见表1-3),表示需做9次实验,最多可观察4个因素,每个因素均为3水平。这类正交表名称的写法举例如图1-2所示。
图1-2 正交表名称
各列水平均为2的常用正交表有:L4(23),L8(27),L12(211),L16(215),L20(219),L32(231)。
各列水平数均为3的常用正交表有:L9(34),L27(313)。
各列水平数均为4的常用正交表有:L16(45)。
各列水平数均为5的常用正交表有:L25(56)。
(2)混合水平正交表。各列水平数不相同的正交表,叫混合水平正交表。如L8(4×24)(表1-4),此表的5列中,有1列为4水平,4列为2水平,即用L8(4×24)安排实验,最多能够考察5个因素,其中一个因素为4水平,另4个因素为2水平,共需要做8次实验。
表1-4 L8(4×24)正交表
下面就是一个混合水平正交表名称的写法:
L8(41×24)常简写为L8(4×24)。此混合水平正交表含有1个4水平列,4个2水平列,共有1+4=5列。
2.正交试验设计的基本步骤
(1)明确实验目的,确定实验指标。
(2)选择因素,确定因素水平,列出因素水平表。由于不可控因素通常难以人为控制,所以不作为考察因素。将对实验指标影响较大但又没有把握的可控因素作为考察因素,同时要特别注意不能将重要的可控因素固定在某一状态下进行考察。
(3)选用正交表。先确定实验的因素、水平,再选择适用的正交表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。
选择正交表的基本原则:先看水平数。若各因素全是2水平,就选用L(2*)表。若各因素全是3水平,就选L(3*)表。若各因素的水平数不相同,就选择适用的混合水平表。为了对实验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。要看实验精度的要求。若要求高,则宜取实验次数多的正交表。若实验费用很昂贵,或实验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的正交表。
(4)按选定的正交表设计表头。表头设计就是确定实验要考察的因素在正交表中的位置,如表1-5所示。
表1-5 混凝实验的表头
(5)确定试验方案。根据表头设计,将L9(34)正交表(表1-3)的1、2、3列中的1、2、3换成表1-2所给的相应水平,即可得到实验方案表,如表1-6所示。
表1-6 混凝实验方案表
3.结果分析
通过实验获取的大量实验数据,如何科学分析这些实验数据,并从中得出有价值的结论,是实验设计法中不可缺少的部分。
正交实验设计法的实验数据分析就是要解决以下问题:选定的各因素对实验指标影响的主次关系;从各影响因素的水平中,找出最佳水平,从而确定最佳运行管理条件。
直观分析法是一种常用的实验结果的分析方法,其具体步骤如下。
(1)填写实验指标。实验结束后,将实验结果填入表1-7中,并进行实验结果分析。表中K为各因素不同水平实验指标之和,k为每个因素每个水平所对应的实验指标的平均值,R为极差。
表1-7 混凝正交实验结果直观分析
(2)计算各因素的K、k、R值。
①K
Ki(第j列)=第j列中数字与水平“i”对应的各实验指标之和对于上述的混凝正交实验:
KAj是因素A的3个不同水平实验指标(处理水CODCr)之和;
KBj是因素B的3个不同水平实验指标(处理水CODCr)之和;
KCj是因素C的3个不同水平实验指标(处理水CODCr)之和。
例如,第1列的K1=60+57+68=185(mg/L)。
②k
kAj是因素A的处理水平均CODCr:
kBj是因素B的处理水平均CODCr:
kCj是因素C的处理水平均CODCr;
例如,第2列的K2=154/3=51.3(mg/L)。
③R称为极差,是衡量数据波动大小的重要指标,极差越大的因素越重要。第j列的极差,等于第j列各水平对应的试验指标平均值中的最大值减最小值,即
例如,第3列的R3=56.3-49.3=7.0(mg/L)。
(3)作因素-k关系图。以k为纵坐标,因素水平为横坐标,作因素-k关系图。该图反映了在其他因素变化基本相同的条件下,该因素与指标的关系。表1-7中的k与各因素的关系如图1-3所示。从图中可以看出,影响因素的主次为:加药量→pH值→搅拌时间。
图1-3 k与各因素之间的关系
(4)排出因素的主次序。通过比较各因素R值的大小,排出因素的主次顺序。以混凝正交实验为例,从表1-7可以看出,因素A的极差R最大,是主要因素。因素B的极差最小,对实验指标的影响最小,是次要因素。因素C的级差为因素A、B之间,对实验指标的影响大于因素B,小于因素A。这与因素指标关系图得出的结论是一致的。
上述因素的主次顺序、水平的优劣,都是在某一具体条件下得出的。当实验条件改变了,因素的主次顺序就要发生相应的变化。原来的次要因素会因为实验条件的改变而成为主要因素。
(5)适宜操作条件的确定。从表1-7中可以看出,9个实验中处理水CODCr最小的操作条件为A3B3C2,通过计算分析(最小K值)找出的较好的操作条件也是A3B3C2,因此可以认为A3B3C2是一组好的操作条件,即加药量为15mg/L、搅拌时间为30min、pH值为6。如果计算分析结果与实验得到结果不一致,应将各自得到的好的操作条件再进行两次实验,加以验证,最后确定出好的操作条件。