第一章 正交实验设计
§1.1概述
一.实验设计的目标
任何一个试验都存在: 这两个问题。对于科学的实验设计应能做到:
1). 试验次数尽可能少;
2). 少量试验所获数据能得出正确结论。
对单因素或双因素的实验设计,可进行全组合,逐一交叉重复的实验方式,即可以进行全面实验(但水平数必须有限)。
对多于两个因素的,单用全面实验方法,其工作量将随因素的个数按指数方式剧增,即不经济,又费时间。这种全面实验方法不叫优选法,而叫选优法。
对于单因素试验,可采用0.618法,对分法,平行线法,交替法,调优法等优选法进行试验,以减少试验次数。
对多因素,正交实验设计是一种显著有效的方法。
正交试验设计就是利用正交表来合理安排试验的一种方法。
二. 基本术语
试验因素:对试验结果可能会产生影响的原因,是实验过程中的一些自变量,或条件变量,是输入参数。如炼钢中的某些特种元素的含量,机加工中的刀具形式、走刀量等。
试验指标(响应):试验研究的指标,即实验得出的结果(输出的参数)。 水平:试验因素在试验中所选取的具体状态(或水平)。 如考察刀具磨损。对普通碳素钢:
若温度也为实验因素,如取其三个水平分别为-50℃、20℃及60℃。水平之间的差异也称为水平级位,模糊的说法为低温、常温和高温。
三. 正交设计实验解决的问题
(1). 因素对实验指标的影响,即能分清主要因素和次要因素,或甚微因素和忽略因素。
(2). 找出较好方案的组合,形成最优的生产条件,或能得到较好响应的最佳因素的组合。必要时,对生产过程作出预报,或预报可能的最佳响应。上例中,就有这样的问题,选怎样的组合,使刀具磨损最小。选择怎样的温度,工艺性最好。
§1.2正交表
一.拉丁方与正交表
正交实验最早起源于拉丁方设计思想
18世纪,普鲁士费里德里希.威廉二世,提出要举行一次与往常不同的六列方队阅兵式。他要求每个方队的行和列都得由六种部队的六种军官组成,不得有重复和空缺。这样,六个方队中,部队、军官、行和列全部排列均衡。群臣们冥思苦想,无一人能排出这
样的方阵来。后来向当时著名的数学家 Eular请教,由此引起了数学家们的极大兴趣,提出了一个有趣的数学问题:所谓36个军官问题,当时用不同的拉丁字母A, B, C……表示军官,α,β,γ……表示为团队,交叉排列方阵,称为希腊拉丁方阵。简称拉丁方阵。因希腊字母有限,改用脚标为自然数序列排的方阵A=(aij)n×n,B=(bij)n×n为n阶拉丁方阵。
当A×B=(aij()bij)=0,称为正交拉丁方阵。
直到1901年,G.Tarry才证明“36个军官的正交问题”为无解。但借用拉丁方阵的构造解决了不少的多因素实验优化问题。数学家们如此重视一个君王独出心裁的阅兵式,并不是为了组织什么花样方阵,而是为了研究具有普遍意义的新的数学思想,即均衡分布的思想,这正是今天正交试验设计的思想基础。
例:有三个因素,每个因素有三个水平的实验,全组合搭配试验需进行3=27次。
A1B2C1A2B2C1A3B2C1
3
A1A1A1A1A1A1A1A1
B2B2B3B3B3B1B1B1
C2C3C1C2C3C1C2C3
A2A2A2A2A2A2A2A2
B2B2B3B3B3B1B1B1
C2C3C1C2C3C1C2C3
A3A3A3A3A3A3A3A3
B2B2B3B3B3B1B1B1
C3
C1
C2
C2C3C1C2C
3
上述全搭配试验太多,能不能减少一些呢?
能否每次保留一个因素水平而变动其余的水平进行比对试验呢?
正交试验设计能减少试验次数,又能兼顾均匀搭配的效果!
二.正交表
(1). 定义
设A是n×k的矩阵,它的第j列元素由1,2,……j构成(也可用别的符号),如果矩阵A的任意两列元素都搭配均匀,就称A是一个正交表。如8×7的矩阵:
⎡1⎢1⎢⎢1⎢1⎢A=⎢2⎢⎢2⎢2⎢⎣2
[***********][***********]1221
1⎤2⎥⎥2⎥⎥1⎥
2⎥⎥1⎥1⎥⎥2⎦8×7
注意到,任意两列的相邻元素所构成的都是完全有序对,都包含有四个相同的数字对(1,1),(1,2),(2,1),(2,2),因此A是一个正交表。
正交表的性质:
(1) 每一列中各数字(或称水平)出现的次数相同;如上例中都是4次;
(2) 任意两列的号码所构成的水平对中。每个水平对重复出现的次数相同。如上例中每个水平对重复出现2次。 正交表的特点:
搭配均匀性、组合代表性、综合可比性。
(2). 正交表的种类:
a).标准表
凡是标准表,水平数都相等,且水平数只能取素数或素数幂,利用标准表可考察因素之间的交互作用。
根据正交表设计的思想,运用数学方法,将正交实验中多种因素和水平搭配的结果编成表格,这种规格化的表格称为正交实验设计表,简称正交表。简记为符号:Ln(m). 其中
L-----表示正交表
n-----表示实验方案的个数(表的行数) m-----表示试验因素的水平数
k-----表示最多可安排因素的数目(表的列数)
常见的水平数相同的正交表有:
二水平正交表:L4(23)、L8(27)、L12(211)、L16(215)、L32(231)、……等
三水平正交表:L9(34)、L27(313)、L81(340)……
四水平正交表:L16(45)、L64(421)、L256(4)……
85
K
(1.1)
五水平正交表:L25(56)、L125(331)、L265(5156)……
最简单的L4(23),做四次试验,最多安排2个水平3个因素(而全做2=8次)。
3
L(23
)正交表
b). 混合型正交表
如L8(41×24)混合型正交表。表示1个因素是4个水平的,4个因素是2个水平的,不等水平的混合。其中第一列与其他列的搭配是均匀的。
L(41×24
)
L12(3×2),L12(6×2);
还有如
L16(4×212),L16(42×29);L18(2×3),L18(6×3);
7
6
…… (1.2)
正交表的构造是一个复杂问题,并非给定参数就能构造正交表,一般查用现成即可,下面仅介绍一般的构造方法。
(3).正交表构造的一般方法
正交表的构造是一个组合数学问题,不同类型的表构造方法差异很大。
(a).正交表的正交性及其变换性
线性代数中,两个向量(a1,a2,......,an)和(b1,b2,......,bn),如果内积为0,即 a1b1+a2b2+......+anbn=0
称该两向量正交。
正交表的正交性:
正交表每一列可看成一个列向量,表中数字为因素水平记号(可以数字,或其它代号表示,无本质区别),如二水平的记为1,2,分别用+1,-1来代替也可以。任意两列构成的水平对是一个“完全有序对”,即(-1,-1),(-1,+1),(+1,-1),(+1,+1),重复出现次数相同。则:
[(-1)×(-1)+(-1)×(+1)+(+1)×(-1)+(+1)×(+1)]=0
即二水平正交表任意两列是正交的。
正交表的变换性:
表的列地位平等,各列可以置换; 表的行地位平等,各行可以置换; 同一列中的水平可以置换。
上述称为正交表的三种初等变换,经初等变换后的正交表与原表是等价的(或称同构)。
(b)有限域的概念
由全体有理数组成的集合中,其元素是无限多,因此是无限域。因素和水平数字是有限的,所以它们的域是在有限域内。
记U是一个有限域,一个有限域至少有两个元素,设U3是由3个元素0和1、2组成,元素之间可满足加或乘法的定义,但集合U3(0,1,2)的加法和乘法结果显然不属于U3(如1+2=3),但如果我们新定义两个代数运算(这种运算法则使得运算结果仍是集合中的元素):
⎧a+b=(a和b之和除以Ui中的个数i所得的余数)
⎨
中的个数i所得的余数)a×b=(a和b之积除以U⎩i
或:
c c
加法 a+b= ⎨
⎩ r c=qt+r,0≤r≤t-1
s∠t,s∈Ut⎧s
rs=qt+r,0≤r≤t−1⎩
上式中,q为正整数,t为U集中元素的个数。
乘法 a×b=⎨
例: U2加法 U
2乘法
1+1=2,2∈U2
2/2=1,无余数,故为零。
U3加法 U3乘法
U5加法 U
5减法
计算结果表明,每行每列均构成独立向量,彼此不相关。正交表便利用这种算法构造因素水平的顺序。一般可以设m为因素的水平数, k为因素个数,则全组合的试验次数Q为(即k维向量的总数): Q=m
其独立向量个数的计算式为:
例如:U3={0,1,2},三维向量全组合k=3=27。但其独立向量:
3
k
n=(mk−1)m−1)
3
n=(3−1)−1)=13
于是可利用向量的运算法则构造27行、13列的正交表,L27(313)
(c)Ln(mk)型正交表构成
以L9(34)表说明其构成方法,该表是适用于4因素,3水平的试验。其U3(0,1,2)中取两维向量3=9个(即试验的总次数为9),将9按顺序置于表的最左列,其独立向量只有4个(4个因素),依次置于正交表的最上面一行各列中,即(1,0),(0,1),(1,1),(2,1)。行向量(a1,a2),独立的有序对。列向量以表示(x1,x2),水平表中的各水平数,即对应行、列向量交叉处的数字lij,则:
2
lij=ai1⋅xj1+ai2⋅xj2
第一行、第一列元素:l11=a11⋅x11+a12⋅x12=1×0+0×0=0 第二行、第二列元素:l22=a21⋅x21+a22⋅x22=0×0+1×1=1
第一章 正交实验设计
§1.1概述
一.实验设计的目标
任何一个试验都存在: 这两个问题。对于科学的实验设计应能做到:
1). 试验次数尽可能少;
2). 少量试验所获数据能得出正确结论。
对单因素或双因素的实验设计,可进行全组合,逐一交叉重复的实验方式,即可以进行全面实验(但水平数必须有限)。
对多于两个因素的,单用全面实验方法,其工作量将随因素的个数按指数方式剧增,即不经济,又费时间。这种全面实验方法不叫优选法,而叫选优法。
对于单因素试验,可采用0.618法,对分法,平行线法,交替法,调优法等优选法进行试验,以减少试验次数。
对多因素,正交实验设计是一种显著有效的方法。
正交试验设计就是利用正交表来合理安排试验的一种方法。
二. 基本术语
试验因素:对试验结果可能会产生影响的原因,是实验过程中的一些自变量,或条件变量,是输入参数。如炼钢中的某些特种元素的含量,机加工中的刀具形式、走刀量等。
试验指标(响应):试验研究的指标,即实验得出的结果(输出的参数)。 水平:试验因素在试验中所选取的具体状态(或水平)。 如考察刀具磨损。对普通碳素钢:
若温度也为实验因素,如取其三个水平分别为-50℃、20℃及60℃。水平之间的差异也称为水平级位,模糊的说法为低温、常温和高温。
三. 正交设计实验解决的问题
(1). 因素对实验指标的影响,即能分清主要因素和次要因素,或甚微因素和忽略因素。
(2). 找出较好方案的组合,形成最优的生产条件,或能得到较好响应的最佳因素的组合。必要时,对生产过程作出预报,或预报可能的最佳响应。上例中,就有这样的问题,选怎样的组合,使刀具磨损最小。选择怎样的温度,工艺性最好。
§1.2正交表
一.拉丁方与正交表
正交实验最早起源于拉丁方设计思想
18世纪,普鲁士费里德里希.威廉二世,提出要举行一次与往常不同的六列方队阅兵式。他要求每个方队的行和列都得由六种部队的六种军官组成,不得有重复和空缺。这样,六个方队中,部队、军官、行和列全部排列均衡。群臣们冥思苦想,无一人能排出这
样的方阵来。后来向当时著名的数学家 Eular请教,由此引起了数学家们的极大兴趣,提出了一个有趣的数学问题:所谓36个军官问题,当时用不同的拉丁字母A, B, C……表示军官,α,β,γ……表示为团队,交叉排列方阵,称为希腊拉丁方阵。简称拉丁方阵。因希腊字母有限,改用脚标为自然数序列排的方阵A=(aij)n×n,B=(bij)n×n为n阶拉丁方阵。
当A×B=(aij()bij)=0,称为正交拉丁方阵。
直到1901年,G.Tarry才证明“36个军官的正交问题”为无解。但借用拉丁方阵的构造解决了不少的多因素实验优化问题。数学家们如此重视一个君王独出心裁的阅兵式,并不是为了组织什么花样方阵,而是为了研究具有普遍意义的新的数学思想,即均衡分布的思想,这正是今天正交试验设计的思想基础。
例:有三个因素,每个因素有三个水平的实验,全组合搭配试验需进行3=27次。
A1B2C1A2B2C1A3B2C1
3
A1A1A1A1A1A1A1A1
B2B2B3B3B3B1B1B1
C2C3C1C2C3C1C2C3
A2A2A2A2A2A2A2A2
B2B2B3B3B3B1B1B1
C2C3C1C2C3C1C2C3
A3A3A3A3A3A3A3A3
B2B2B3B3B3B1B1B1
C3
C1
C2
C2C3C1C2C
3
上述全搭配试验太多,能不能减少一些呢?
能否每次保留一个因素水平而变动其余的水平进行比对试验呢?
正交试验设计能减少试验次数,又能兼顾均匀搭配的效果!
二.正交表
(1). 定义
设A是n×k的矩阵,它的第j列元素由1,2,……j构成(也可用别的符号),如果矩阵A的任意两列元素都搭配均匀,就称A是一个正交表。如8×7的矩阵:
⎡1⎢1⎢⎢1⎢1⎢A=⎢2⎢⎢2⎢2⎢⎣2
[***********][***********]1221
1⎤2⎥⎥2⎥⎥1⎥
2⎥⎥1⎥1⎥⎥2⎦8×7
注意到,任意两列的相邻元素所构成的都是完全有序对,都包含有四个相同的数字对(1,1),(1,2),(2,1),(2,2),因此A是一个正交表。
正交表的性质:
(1) 每一列中各数字(或称水平)出现的次数相同;如上例中都是4次;
(2) 任意两列的号码所构成的水平对中。每个水平对重复出现的次数相同。如上例中每个水平对重复出现2次。 正交表的特点:
搭配均匀性、组合代表性、综合可比性。
(2). 正交表的种类:
a).标准表
凡是标准表,水平数都相等,且水平数只能取素数或素数幂,利用标准表可考察因素之间的交互作用。
根据正交表设计的思想,运用数学方法,将正交实验中多种因素和水平搭配的结果编成表格,这种规格化的表格称为正交实验设计表,简称正交表。简记为符号:Ln(m). 其中
L-----表示正交表
n-----表示实验方案的个数(表的行数) m-----表示试验因素的水平数
k-----表示最多可安排因素的数目(表的列数)
常见的水平数相同的正交表有:
二水平正交表:L4(23)、L8(27)、L12(211)、L16(215)、L32(231)、……等
三水平正交表:L9(34)、L27(313)、L81(340)……
四水平正交表:L16(45)、L64(421)、L256(4)……
85
K
(1.1)
五水平正交表:L25(56)、L125(331)、L265(5156)……
最简单的L4(23),做四次试验,最多安排2个水平3个因素(而全做2=8次)。
3
L(23
)正交表
b). 混合型正交表
如L8(41×24)混合型正交表。表示1个因素是4个水平的,4个因素是2个水平的,不等水平的混合。其中第一列与其他列的搭配是均匀的。
L(41×24
)
L12(3×2),L12(6×2);
还有如
L16(4×212),L16(42×29);L18(2×3),L18(6×3);
7
6
…… (1.2)
正交表的构造是一个复杂问题,并非给定参数就能构造正交表,一般查用现成即可,下面仅介绍一般的构造方法。
(3).正交表构造的一般方法
正交表的构造是一个组合数学问题,不同类型的表构造方法差异很大。
(a).正交表的正交性及其变换性
线性代数中,两个向量(a1,a2,......,an)和(b1,b2,......,bn),如果内积为0,即 a1b1+a2b2+......+anbn=0
称该两向量正交。
正交表的正交性:
正交表每一列可看成一个列向量,表中数字为因素水平记号(可以数字,或其它代号表示,无本质区别),如二水平的记为1,2,分别用+1,-1来代替也可以。任意两列构成的水平对是一个“完全有序对”,即(-1,-1),(-1,+1),(+1,-1),(+1,+1),重复出现次数相同。则:
[(-1)×(-1)+(-1)×(+1)+(+1)×(-1)+(+1)×(+1)]=0
即二水平正交表任意两列是正交的。
正交表的变换性:
表的列地位平等,各列可以置换; 表的行地位平等,各行可以置换; 同一列中的水平可以置换。
上述称为正交表的三种初等变换,经初等变换后的正交表与原表是等价的(或称同构)。
(b)有限域的概念
由全体有理数组成的集合中,其元素是无限多,因此是无限域。因素和水平数字是有限的,所以它们的域是在有限域内。
记U是一个有限域,一个有限域至少有两个元素,设U3是由3个元素0和1、2组成,元素之间可满足加或乘法的定义,但集合U3(0,1,2)的加法和乘法结果显然不属于U3(如1+2=3),但如果我们新定义两个代数运算(这种运算法则使得运算结果仍是集合中的元素):
⎧a+b=(a和b之和除以Ui中的个数i所得的余数)
⎨
中的个数i所得的余数)a×b=(a和b之积除以U⎩i
或:
c c
加法 a+b= ⎨
⎩ r c=qt+r,0≤r≤t-1
s∠t,s∈Ut⎧s
rs=qt+r,0≤r≤t−1⎩
上式中,q为正整数,t为U集中元素的个数。
乘法 a×b=⎨
例: U2加法 U
2乘法
1+1=2,2∈U2
2/2=1,无余数,故为零。
U3加法 U3乘法
U5加法 U
5减法
计算结果表明,每行每列均构成独立向量,彼此不相关。正交表便利用这种算法构造因素水平的顺序。一般可以设m为因素的水平数, k为因素个数,则全组合的试验次数Q为(即k维向量的总数): Q=m
其独立向量个数的计算式为:
例如:U3={0,1,2},三维向量全组合k=3=27。但其独立向量:
3
k
n=(mk−1)m−1)
3
n=(3−1)−1)=13
于是可利用向量的运算法则构造27行、13列的正交表,L27(313)
(c)Ln(mk)型正交表构成
以L9(34)表说明其构成方法,该表是适用于4因素,3水平的试验。其U3(0,1,2)中取两维向量3=9个(即试验的总次数为9),将9按顺序置于表的最左列,其独立向量只有4个(4个因素),依次置于正交表的最上面一行各列中,即(1,0),(0,1),(1,1),(2,1)。行向量(a1,a2),独立的有序对。列向量以表示(x1,x2),水平表中的各水平数,即对应行、列向量交叉处的数字lij,则:
2
lij=ai1⋅xj1+ai2⋅xj2
第一行、第一列元素:l11=a11⋅x11+a12⋅x12=1×0+0×0=0 第二行、第二列元素:l22=a21⋅x21+a22⋅x22=0×0+1×1=1