现代数学方法讲稿
第一部分:现代实用统计方法
第一章:正交设计的基本知识(Orthogonal Design ) 1.1试验设计概述 试验与试验设计
所谓试验,一般指用于发现新的现象、新的事物、新的规律,以肯定或否定先前的调查研究结论、发现新规律而进行的有计划活动。试验的实质:是一种用以测定过程或系统某些特定性能的有目的的测试。
试验设计是数理统计学领域的一个分支。它是以概率论、数理统计、线性代数等为理论基础,科学地设计试验方案,正确合理地分析试验结果,以较少的试验工作量和较低的成本获取足够、可靠的有用信息。
试验设计的主要研究内容:
◆ 哪个因素对指标值影响较大?如何影响?
◆ 如何设置各因素的水平,使指标值接近预期的期望值? ◆ 如何设置各因素的水平,使指标值的方差(波动)最小?
◆ 如何设置可控因素的水平,使非可控因素的影响最小?„„ 试验设计的发展历史
试验设计的基本思想和方法是英国统计学家、工程师费歇尔(R.A.Fisher ,1890~1962)于20世纪20年代创立的,他是试验设计的奠基人并对其后的发展做出了卓越的贡献。 试验设计与分析的发展大致可划分为三个历史阶段。 早期、传统试验设计阶段(约1920s~1950s) 费歇尔在农场进行田间试验的过程中,对高产小麦品种遗传进行研究。为减少偶然因素对试验的影响,他对各种试验因素的每一水平组合进行了试验,并通过方差分析评价指标的优劣(用于排除偶然因素的影响),使小麦大幅度增产。 ◆ 1925年,费歇尔在《研究工作中的统计方法》一书中首次提出了“实验设计”的概念; ◆ 1935年,费歇尔出版了著名的《试验设计法》一书; ◆ 40年代前后,英、美、苏等国家将试验设计逐渐应用于工业生产领域及军工生产领域; ◆ 劳尼于40年代提出的多因素试验的部分实施方法后来成为现代试验设计理论的基础。 中期发展阶段(约1950s~1970s,以正交试验设计、回归试验设计为代表)
◆ 40年代末、50年代初,以田口玄一(1924--)为代表的日本电讯研究所(EOL )的研究人员在研究电话通讯设备质量时从英、美引进了试验设计技术,提出了“正交试验设计法”; 该所的产品——线形弹簧继电器,有几十个特性值和两千多个试验因素,经7年研制成功,其性能比美国的同一产品更优。虽然其成本仅几美元,研究费用却用了几百万美元,创造的经济效益高达几十亿美元!同时挤垮了美国的企业。 ◆ 50年代初,创立了“回归试验设计法”;
◆ 1957年,田口玄一又提出了“信噪比(S/N)试验设计”;
二战后日本经济迅速发展的原因之一就是在工业领域普遍推广和应用正交试验设计和产品三次设计,因此在日本把正交试验设计技术称为“国宝”。 ◆ 1959年,G.E. 博克斯和J.S. 亨特尔提出了调优操作(EVOP ),也称为调优试验设计法; ◆ 70年代中期,田口玄一提出了“产品三次设计”。 ● 现代试验设计阶段(1970s~)
◆ 自70年代开始,S/N试验设计及产品三次设计开始了实质性的应用; ◆ 80年代,我国学者方开泰(南开大学)创立了“均匀试验设计”;
◆ 80年代开始,田口提出走质量工程学的道路,编著了《质量工程学》丛书,将质量管理、质量控制与试验设计结合起来,使试验设计发展到了一个新的水平。 试验设计发展的三个里程碑:
◆ 费歇尔创立了早期、传统的试验设计理论、方法; ◆ 正交表的开发及正交实验设计的应用; ◆ 信噪比试验设计和产品三次设计的应用。 我国试验设计的发展情况:
◆ 50年代开始研究;◆ 60年代提出观点;
◆ 70年代开始实质应用;◆ 80年代提出均匀试验设计理论。 1.2正交设计的基本概念 正交试验设计(Orthogonal Design )是于二十世纪50年代初期,由日本质量管理专家田口玄一(Tachugi )博士提出的在多因素试验设计方法的基础上,进一步研究开发出来的一种试验设计技术。
正交试验设计法使用一种规范化的表格(正交表)进行试验设计,可以用较少的试验次数,取得较为准确、可靠的优选结论。正交试验设计的基础是正交表。 (1) 试验指标(简称指标)
根据试验目的所选定的、用来考察试验结果的特性值。 ● 按指标的性质分
★ 定量(数值)指标:用数值表示特性值的指标(如重量、强度、精度、寿命、成本等)。 ★ 定性(非数值)指标:不能用数值表示特性值的指标(如光泽、颜色、味道、手感等)。 注意:◆ 每个指标唯一表示一种特性(性质、状态),某一试验过程中不能用多个指标重复表示同一种特性。 ◆ 试验指标应尽可能采用定量(数值)指标(如重量、成本、寿命等)。对于定性指标在实际中为便于分析,也常划分成几个不同等级从而定量化,如颜色可一一对应于数字,从而定量化。0、1数据(如合格与否、电路的通与断等)。 ● 按试验指标的数量分
★ 单指标:试验指标只有一个。★ 多指标:试验指标只有多个。 (2)试验因素(简称因素)
对试验结果(特性值)可能有影响的原因或要素。如在生产中考虑指标:产量,则影响产量的因素可能有温度A ,时间B ,化学催化剂用量C 等,常用大写英文字母A 、B 、C„等表示。 ★ 可控因素:人可以控制、调节的因素(如加热温度、切削速度等)。
★ 不可控因素:人不可控制、调节的因素(如机床的随机振动、试验中的随机误差等)。 注意:试验设计中主要考虑可控因素,不可控因素的影响通过数据处理来处理。实际中因素变化都是在一个范围内变化,此时应选择几个具有代表性的值来表示因素的不同影响,这些值就为
(3)因素的水平
试验中因素变化的状态和条件称为因素的水平或位数,简称水平。因素A 的水平用代表因素的字母加下标表示,记为A1,A2,„Ak
在实验中如何去选择因素和水平关系到试验能否成功(有效)的关键,那么如何去选择呢? 让我们先看一个例子:
例1 在一个化工生产过程中,考虑影响得率(产量)的三个因素:温度(A),时间(B)和加碱量(C)。为了便于试验的安排,每个因素要根据以往的经验来选择一个试验范围,然
后在试验范围内挑出几个有代表性的值来进行试验,这些值称做该因素的水平。在该例中,我们选择的试验范围如下:
温度: 77.5℃~92.5℃时间: 75分~165分加碱量: 4.5%~7.5% 然后在上述范围内,每个因素各选三个水平,组成如下的因素水平表:
选择因素和水平关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计的人员可能是有益的。
1.在一个生产过程中,有关的因素通常是很多的,例如在例1的化工生产工艺中,有催化剂的品种,催化剂用量,加碱时的速度,容器中的压力等。但根据这次试验目的,除了温度(A ),时间(B ),和加碱量(C )各取三个水平外,其余因素是固定的,或者讲,他们只取一个水平。为了方便,通常这些固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。
2.在一项试验中,如何从众多的有关因素中挑选出试验方案中的因素?我们建议课题的领导者应当要请有经验的工程师、技术员、工人共同讨论决定。在一次试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。相反地, 因素也不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的。例如,有这样的故事,原计划试验方案中只有三个因素,而利用试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,既然不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是最重要的,从而发现了历史上最好的工艺条件,正是“有心栽花花不成,无意插柳柳成荫。”
3.试验的范围应当尽可能大一点。如果试验在试验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不易获得比已有条件有显著改善的结果。历史上有些重大的发明和发现,是由于“事故”而获得的,也就是说试验的范围大大不同于有经验的范围。
4.若试验范围允许大一些,则每一因素的水平个数最好适当多一些。
5.水平的间隔大小和生产控制精度是密切相关的。若在例1中温度的控制只能作到
±3℃, 且我们设定控制在85℃, 于是在生产过程中温度将会在85°±3℃, 即82—88℃波动。不难看到,这时设定的三个水平80℃,85℃,90℃之间是太近了,应当加大,例如80℃,90℃,100℃。如果温度控制的精度可达±1℃, 则例1如设定的三个水平是合理的。 6.因素和水平的含意可以是广义的。例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平
在一次试验中每个因素总取一个特定的水平,称各因素水平的一个组合为一个水平组合或一个试验条件。如A2B2C3。
多因素试验遇到的最大困难是试验次数太多,若十个因素对产品质量有影响,每个因素取两个不同水平进行比较,有210=1024、 如果每个因素取三个不同水平310=59049个不同的试验次数。
在多因素试验中,有人采用“单因素轮换法”,但是这种方法不一定能找到好的结果
譬如:考察两个因素,先固定A 在A1,发现B3好,再固定B3,发现A1好,但是实际上好的条件是A2B2。
B1 B2 B3 A1 50 56 62
A2 56 70 60 A3 54 60 58
选择部分条件进行试验,再通过数据分析来寻找好的条件,这便是试验设计问题。通过少量的试验获得较多的信息,达到试验的目的:发现那些因素对试验结果确有影响,因素的什么水平组合是最好的。
通过合理、科学的试验设计,可以显著提高产品的设计、开发质量,找出最佳的工艺条件,从而提高产品最终的质量。
田口认为,设计质量(包括产品设计和工艺设计)对整个产品质量的贡献约为60%~70%。 试验的主要步骤(阶段)
● 试验设计阶段——选题、设计试验方案、准备试验材料及设备、安排试验环境等; ● 试验实施阶段——按计划进行试验(包括试验操作、收集试验数据等);
● 试验分析阶段——核查试验数据、进行统计分析、解释试验结果、获取试验结论等。 试验设计的基本原则(费歇尔三原则)
● 重复原则——利用重复观测减小试验误差,提高试验精度;
● 随机化原则——目的是为了消除或减小人为因素引起的系统误差的影响;
● 局部控制原则——该原则也称为区组控制原则,指的是把比较的水平设置在差异较小的区组内,其目的也是为了消除或减小试验中系统误差的影响。例如,按机器设备、班次、原料批号、操作人员划分区组。
1.2 试验设计的统计学基础 常用统计量 1.极差
极差指的是一组数据中的最大值与最小值之差,也称为变异幅。R =x m ax -x m in 极差反映了一组数据的最大离散程度。 2. 和与平均值
设有n 个观测值x 1, x 2, xn 构成的一组数据,定义
1n T
和:T =∑x i 平均值 =∑x i =
n i =1n i =1
n
3.偏差(离差)
偏差有以下两种表示方法:
◆ 观测值与期望值μ之差:d i =x i -μ(i =1, 2, , n ) ◆ 观测值与平均值之差:v i =x i -(i =1, 2, , n )
由于期望值通常是未知的,因此试验中常使用后者,前者只用于理论分析中。 注意:
∑v =∑(x
i i =1
i =1
n n
i
-) =0
4. 偏差平方和与自由度
偏差平方和用来表示一组数据的离散程度,通常用S 表示。 存在期望值时:S =
2
2
∑(x -μ)
i
i =1
n
2
不存在期望值时:S =
2
∑(x
i =1
n
i
-) 2
自由度指的是关系式中独立数据的个数,通常用 f 表示。
例如,在计算偏差平方和的过程中,若表达式中使用的是期望值μ ,则 f=n;若表达式中使用的是平均值,则因为存在约束条件
∑(x
i =1
n
i
-) =0而使独立数据的个数少了一个,因
此f=n-1 。
5. 方差与均方差
方差也称为平均偏差平方和,表示单位自由度所对应的偏差大小,通常用 V 表示:
1n 1n 2
V =S /f . 存在期望值时:V =∑(x i -μ) , 不存在期望值时:V =(x i -) 2 ∑n -1i =1n i =1
2
均方差也称为准偏差或标准差,定义为方差的平方根,通常用σ表示,即存在期望值时:
σ==
6. 样本及其分布 总体(population ):被研究对象的全体 样本(sample ):用一定方法从总体中抽取的一组个体称为总体的一个样本。 ※ 与样本有关的几个术语: ● 抽样(采样,取样):从总体抽取样本的过程。
● 随机样本:个体是随机抽取的样本(无特指均认为是随机样本)。 注意:
◆ 由于试验要受到各种条件的限制,通常无法对总体进行研究,而是对某个或某些样本的
1n
(x i -μ) 2不存在期望值时:σ==∑n i =11n
(x i -) 2 ∑n -1i =1
性质进行研究,通过样本来推断总体的特征。 ◆ 总体是随机变量,总体的样本也是随机变量。
◆ 科学实验中的抽样一般要求是完全独立、随机的,且应使每组样本的观测值之间互不影响,以最大限度使样本具有与总体相同的分布规律。 7. 样本统计量
对于给定的一个样本,可以计算其数字特征,并冠以“样本”二字,以示和总体数字特征的区别。例如:
1n
样本的均值=∑x i =m 1,
n i =1
1n n 2'
样本的方差v =
(x -) =m 2∑i
n -1i =1n -1
全厂所有N 个工人的产品质量
从N 个工人中随机抽取n 个工人的产品质量作为样本
每个工人的产品质量仍为随机变量,可能取得不同的观测值
此外还有三大分布和假设检验。这个用到时再来具体谈谈。 1.3正交与正交表 1.3.1正交
在数学上,两个向量A (a 1, a 2, , a n ) 和B (b 1, b 2, , b n ) 若满足
A ∙B =a 1b 1+a 2b 2+ +a n b n =0即两向量的内积等于零,则称此两向量正交。
由于在构造正交表的过程中使用了上述原理,因此将相应的试验设计法称为正交试验设计。 1.3.2正交表
1 完全有序元素对(完全对)
设有两组元素(a 1, a 2, , a n ) 与(b 1, b 2, , b k ) ,它们可构成如下的元素对:
(a 1, b 1),
(a 1, b 2), (a 1, b k )
(1, 1), (3, 1),
(1, 2), (3, 2),
(1, 3) (3, 3)
(a 2, b 1), (a 2, b 2), (a 2, b k ) (a n , b 1), (a n , b 2), (a n , b k )
(2, 1), (2, 2), (2, 3) (4, 1), (4, 2), (4, 3)
称这些元素对为由两元素构成的“完全有序元素对”,简称“元素对”。若元素为数字,则称为“完全有序数字对”。
例:由数字(1,2,3,4)和 (1,2,3)构成的完全有序数字对为: 如上 若在一个矩阵的任意两列中,由两列中的对应元素所构成的数字对是完全对且每对出现的次数相等,则称这两列是均衡搭配,否则就是不均衡搭配。例如:
第I 列 第II 列 第III 列
⎡1⎢1⎢⎢1⎢1A =⎢
⎢2⎢⎢2⎢2⎢⎢2⎣
11221122
1⎤
2⎥⎥1⎥⎥2⎥2⎥⎥2⎥2⎥⎥2⎦⎥
(1, 1)
第I 列与第II 列中的对应元素构成8个数字对:
(1, 1) (1, 2) (2, 1)
(1, 2) (2, 1)
(2, 2) (2, 2)
它们是由元素(1,2)和元素(1,2)构成的完全数字对,每对各出现两次,因此称这两列为均衡搭
配。而第I 列与第III 列、第II 列与第III 列,由于每对出现的次数不相同,因此均为不均衡搭配。
2.正交表的定义与格式
定义:设A 是一个n ⨯k 的矩阵(n 行k 列),其中第 j 列元素由元素(1, 2, , m ) 构成
(j =1, 2, , k ) ,若A 的任意两列均衡搭配,则称A 是一张正交表。例如:L 4(23) 正交表
列号(因素)
行号(试验号)
11122
21212
31212
1234
L 8(4×2) 正交表
列号(因素)
行号(试验号)
4
111223344
212121212
312122121
412211221
512212112
12345678
正交表用符号L n (m 1⨯m 2⨯ ⨯m k ) 表示,其中
L ——正交表的代号,是Latin Square(拉丁方格)的首字母; K ——正交表的列数,每一列对应着一个试验因素; n ——正交表的行数,表示试验的次数;
m j (j =1, , k ) ——第 j 列中元素的个数,表示试验中第 j 个因素所取的水平数。若某些
列中的元素个数相同,可以写成指数的形式。
例如:L 4(2) =L 4(2⨯2⨯2) ,L 8(4⨯2) =L 8(4⨯2⨯2⨯2⨯2) 此外还有三水平表,四水平表和混合水平表。L 164⨯2多安排三个“4”水平因素,六个“2”水平因素。
3
4
(
36
)表示要求做16次试验,允许最
从这些水平表可见正交表的性质
◆ 任意列中各水平重复出现的次数相等。第 j 列中各水平重复出现的次数:t =n /m j ◆ 任意两列所构成的水平对是完全有序数字对,各水平对重复出现的次数相等(均衡搭配)。第 i 列与第 j 列所构成的水平对重复出现的次数:t =n /(m i ⨯m j )(i ≠j )
根据正交表的上述两个性质,可得到正交表的三种初等变换: ◆ 列间置换:正交表中任意两列可以相互交换; ◆ 行间置换:正交表中任意两行可以相互交换;
◆ 水平置换:正交表中任意一列中的水平数字可以相互交换(例如“3”←→“4”)。 (经过上述初等变换后的表仍为正交表,称变换后的正交表为原正交表的等价表) 说明:若用关于零对称的数字表示不同水平(例如二水平用-1、1表示;三水平用-1、0、1表示;四水平用-2、-1、1、2表示),则任意两列元素的内积为零(正交表由此得名)。 用正交表设计出来的试验方案之所以合理,是因为具有如下两个重要的特征: ● 均衡搭配——正交性
可以用较少的试验次数替代全部可能试验组合中好的、中等的、不好的搭配组合,使选出的较少的搭配组合具有均衡的代表性。 ● 综合可比——数据分析的依据
可把复杂的多因素试验数据处理问题转化成单因素试验数据处理。
通过试验数据的适当组合,可发现各组试验数据以及各因素影响之间的某种可比性。 3.正交表的种类
◆ 水平数相同的正交表(m 水平正交表)
此类正交表中m 1=m 2= =m k =m ,因此通常简记为L n (m ) ,如L 4(2) 等。此类正交表又分为两种:
★ 标准型正交表(最常用):水平数为素数或素数整数幂的正交表。例如:
k
3
L 4(23) L 8(27) L 16(215) L 9(34) L 27(313)
★ 非标准型正交表:标准型之外的水平数相同的正交表。 ◆ 水平数不同的正交表
此类正交表中,某两列(或多列)之间的水平数不等。例如:
L 8(4⨯24) L 12(3⨯24) L 16(42⨯29)
4.如何用正交表安排试验 无交互作用的表头设计
若用正交表来安排例1的试验,其步骤十分简单,具体如下:
(1)选择合适的正交表。适合于该项试验的正交表有L 93, L 182⨯3, L 273我们取L 93,因为所需试验数较少。
(2)将A ,B ,C 三个因素放到L 93的任意三列的表头上,例如放在前三列。 (3)将A ,B ,C 三例的“1”,“2”,“3”变为相应因素的三个水平。
()(
4
7
)()等,
13
()
4
()
4
(4)9 次试验方案为:第一号试验的工艺条件为A 1 (80℃) ,B 1 (90分) ,C 1 (5%); 第二号试验的工艺条件为A 1 (80℃) ,B 2 (120分) ,C 2 (6%)„。这样试验方案就排好了。 有交互作用的正交设计 在许多试验中,不仅因素对试验指标单独产生影响,某些因素之间还会联合搭配起来对试验指标产生影响。因素对试验指标的总影响等于各因素单独对试验指标的影响与因素搭配对试验指标的影响之和。因素之间的联合搭配作用称为对试验指标的交互作用。因素A 与B 的交互作用,记为A ×B 或AB 。
例:在大豆试验田内施用氮肥和磷肥,亩产量如下表:
磷肥
氮肥
N1=0N2=6
P1=0
P2=4
400430
450560
交互作用:(560-400)-(450-400)-(430-400) =160-50-30=80(斤) 因素A 与B 的交互作用示意图
12
a. 无交互作用b. 有(正向)交互作用c. 有(反向)交互作用
因素间的交互作用随着因素个数的增加而增加。如四个因素A ,B ,C ,D 间的交互作用有以下几类:
二级交互作用有6个:AB ,AC ,AD ,BC ,BD ,CD 三级交互作用有4个:ABC ,ABD ,ACD ,BCD 四级交互作用1个:ABCD
共有11个,比因素个数还多。实际经验表明,多数交互作用是不存在的或很小以至可以忽略不计,实际中主要考虑部分二级交互作用,具体考察哪些二级交互作用还要依赖专业知识来决定。 L 8(2) 正交表的交互作用表
列号
1
(1)
7
2
3
(2)
3
21
(3)
4
567
(4)
5
4761
(5)
6
74523
(
6)
7
654321
表头设计
正交表的选用原则
基本原则:要考察的因素及交互作用的自由度总和不大于正交表的总自由度。 即: f总≥ fA+ fB+ fC+„+fA × B+fB × C+fA × C+„
注:(1)正交表总自由度f 总=试验次数-1; (2)每因素自由度=各因素水平数-1;( 如:fA =A 的水平数-1)交互作用自由度,如fA ×B = fA × fB
有交互作用时的正交试验设计还应注意:
◆ 交互作用作为单独的一列来处理,但不是一个因素,是两因素的联合搭配。 ◆表头设计的一个重要原则:表头设计时要尽量避免混杂现象的出现。
这是因为,当混杂现象所在列显著时,很难识别是哪个因素(或交互作用)是显著的。混现象:在进行表头设计时,若一列上出现两个因素,或两个交互作用,或一个因素与一个交互作用时,称为混杂现象,简称“混杂”。 ◆ 交互作用只用于试验结果分析,此时把交互作用作为一个因素来对待。
◆ 有时因素的作用不明显,但因素与其他因素的交互作用对试验指标的影响却非常大(此时应特别注意优化水平的确定,否则将对试验指标产生重大的影响)。 给出下列试验的表头设计:
(1)A 、B 、C 、D 为二水平因素,且要考察交互作用A ×B 、A ×C ;
(2)A 、B 、C 、D 为二水平因素,且要考察交互作用A ×B 、C ×D 。
(1)由于因素均为二水平的,故选用二水平正交表,又因素与交互作用的自由度之和为: f A +f B +f C +f D +f A ×B +f A ×C =1+1+1+1+1+1=6
故所选正交表的行数应满足:n ≥6+1=7,所以选L
(27) ,表头设计如下:
(2)由于因素均为二水平的,故仍选用二水平正交表,又因素与交互作用的自由度之和6,故所选正交表的行数应满足:n ≥6+1=7,但L 8(27) 无法安排这四个因素与两个交互作用,因为不管四个因素放在哪四列上,两个交互作用或一个因素与一个交互作用总会共用一列,从而产生混杂,譬如:
p
k
对等水平的完全正交表来讲L n (q ) ,如果n =q ,则全部列被分为k 组,各组的列数分别为q , q , , q 。
如L 8(27) 的列被分成三个组:第一组:第1列:第2、3两列第三组:第4、5、6、7四列 •正交表上有交互作用的两列如果在不同组时,则其交互作用列必在组别高的组中,当有交互作用的两列在同一组时,交互作用必在低组别的组中。
譬如: - 若A 置于第1列,B 置于第2列,则A ×B 为第3列; - 若A 置于第1列,B 置于第4列,则A ×B 为第5列; - 若A 置于第2列,B 置于第3列,则A ×B 为第1列;
- 若A 置于第4列,B 置于第7列,则A ×B 为第3列。
15
当出现混杂现象时,只要选择较大的正交表就可以避免了,譬如选用L 16(2) ,表头设计
1
k -1
(也
715
称为基本列)。如: L 8(2) 的基本列是1,2,4列,- L 16(2) 的基本列是1,2,4,8列。
第三节:正交试验设计的极差分析(直观分析)
直观分析是通过简单地计算各因素水平对试验结果的影响,并用图表形式将这些影响表示出来,再通过极差分析(找出最大值、最小值),最终确定出优化的水平搭配方案(生产方案),或找出因素对试验结果的影响程度。 根据所考查的试验指标的多少,正交试验设计可分为单指标正交试验设计和多指标正交试验设计两种。本节仅讨论单指标正交试验设计的直观分析。 书上例1.3
(1)试验方案设计:设计试验方案时,首先要明确试验要解决的问题(粉状粒),即明确试验指标——粉状粒(越高越好);然后明确影响试验指标的主要因素,选取适当的因素水平。 ■ 明确试验指标和影响因素,制定因素水平表
试验指标:粉状粒, 影响因素:四个,每个因素各选取了三个水平进行试验 ■ 选择正交表,设计表头
根据因素及水平的多少,选择四因素、三水平的正交表L 9(3) ,如下:
因素列号
A 1
B 2
C 3
D 4
4
■ 根据正交表确定试验方案
按正交表L 9(3) 的内容及所设计的表头,将试验方案填入正交表中(如书)
(2)按设计的试验方案进行试验 (3)试验结果的计算与分析
试验结果的计算与分析主要解决以下三个问题(试验的目的): ◆ 分清各因素对试验指标影响的主次顺序;
◆ 找出(确定出)优化生产方案,即确定出采用什么样的因素水平组合才能使试验指标达到最优;
◆ 分析试验因素对试验指标的影响趋势;为进一步试验指明方向。 ■ 直接分析
由试验数据可以直接看出,在#1号试验(A1B1C1D1)的工艺条件下,粉状粒最高。
但这种条件是否就是因素水平的最佳搭配呢?在9种方案之外还有没有更好的水平搭配呢?(本来总共有3 81次实验)1号试验在这9种方案中最优,并不表示在所有方案中是最优的,这需要通过进一步的计算、分析得到最佳的生产条件。 怎么在不增加实验次数条件下来分析呢? ■ 计算分析
其实我们可以通过对这九组原始试验数据的简单计算,确定各因素水平的影响程度,最终找出最佳生产条件。
(1)寻找最好的试验条件
在A1水平下进行了三次试验:#1,#2,#3,而在这三次试验中因素B 的三个水平各进行了一次试验,因素C 的三个水平也各进行了一次试验。
在A2水平下进行了三次试验:#4,#5,#6,在这三次试验中因素B 与C 的三个水平各进行了一次试验。
在A3水平下进行了三次试验:#7,#8,#9,在这三次试验中因素B 与C 的三个水平各进行了一次试验。
4
4
11
将全部试验分成三个组,那么这这三组数据间的差异就反映了因素A 的三个水平的差异,为此计算各组数据的和与平均:K i ,i ;i=1,2,3(
同理, 对因素B 与C ,D 将数据分成三组分别比较 2)各因素对指标影响程度大小的分析
分析:由于指标要求是粉状粒最高越好,因此由于在因素A 下水平A1下的数据之和最大,故因素A 的第一个水平最优。并且可见A1优于A3优于A2。同理可见: B1优于B2优于B3,C ,D 也同理。
注意:若指标要求越小越好,则水平和或水平均值越小的越好。
上面说明了因素水平哪个最优,分清了各因素对试验指标影响的主次顺序;找出(确定了)优化生产方案,即确定出采用什么样的因素水平组合才能使试验指标达到最优;还有第三个目的没有实现。
(3)各因素不同水平对指标的影响图
极差的大小反映了因素水平改变时对试验结果的影响大小。这里因素的极差是指各水平平均值的最大值与最小值之差,譬如对因素A 来讲:RA =37.0-27.7=9.3其它的结果也列在书上由此可画出试验因素与试验指标关系的趋势图(以各因素的水平为横坐标,以相应水平下的 水平均值为纵坐标)。
根据正交表的综合可比性,由上述计算及趋势图可分析得出以下结论: 按极差计算结果确定主次因素(极差越大,影响越主要)
也可观察趋势图确定主次因素(点子升、降的幅度越大,影响越主要)
可见RB 大于RA 大于RD 大于RC ,从而四因素中因素B 是对指标影响最大的,是主要(最显著)因素。
直接分析结果与后面计算分析结果的比较 直接分析的结果:A1B1C3D1。
◆ 直接分析的结果反映的是正交表中9次试验中的最优水平搭配,但不一定是所有可能的水平搭配(34=81种)中最优的。
◆ 为了展望或寻求更好的搭配,可使用计算分析,通过对趋势的观察,可以找出比直接分析结果更好的水平搭配。
计算分析的结果有时也可能不如直接分析合理,其主要原因可能是:
◆ 试验误差过大; ◆ 存在其它影响因素而未加以考虑;◆ 因素水平选取不当。
第四节:多指标正交试验设计
实际工作中存在着大量的多指标工业试验。在这类试验的设计中,设计与分析较单指标要复杂,各指标之间可能会出现一些矛盾,如何兼顾这些指标呢? 多指标试验设计常用的方法主要有两种: ◆ 综合平衡法 ◆ 综合评分法 1. 综合平衡法
综合平衡法是一种先对每一指标分别进行分析,找出一些较满意的水平组合,再与实际情况相结合,综合考虑各个指标之间关系,最后得出一个或几个较为满意的水平组合的方法。 例见书1.4
● 明确试验目的,确定试验指标
精泥产率(望大),精泥中Fe 2O 3含量(望小),精泥中Fe 2O 3分布率(望小)
12
∑K
i
=T , T 为9次试验的偏差之和)
● 确定试验因素,选择因素水平
由实践经验得知,有四个因素对试验指标产生主要影响,故考查这四个因素,每个因素取三水平。
● 选择正交表,设计表头
本试验属四因素、三水平试验,故选用正交表L 9(34),表头见后。 ● 根据正交表设计试验方案,进行试验,收集试验数据 对每种水平搭配进行试验,得到实验数据
● 对各指标的试验数据分别进行计算(同单指标),并进行直接分析和计算分析
计算指标对应于同一因素水平的水平均值,极差,画出趋势图,按极差大小排出主次因素。 结果:精泥中Fe 2O 3含量(望小)(主) A→B →C →D (次) 精泥中Fe 2O 3分布率(望小)(主)D →B →A →C (次) ◆ 初选最优生产条件。
精泥中Fe 2O 3含量:A3B23C3D13;精泥中Fe 2O 3分布率:A2B3C1D1
但这些都只是单个指标下最优水平组合,在同时考虑这两个指标时,显然上面两个都不一定是最优的组合,那么到底如何去寻找一个适当的对两个指标来说都比较好,对整体来说最优的水平组合呢?
◆ 综合平衡,选取最优生产条件。
先按指标中处于主要地位的因素考虑其较为好的水平,再由别的指标中次要地位的因素来 选取其相对来说最好的水平。
因素A :对指标精泥中Fe 2O 3含量来说A 为最主要因素,故最先考虑,最好是选取A3,其次应选取A2,最不好的是A1。而对指标精泥中Fe 2O 3分布率(望小)而言,因素A 处于三号位置,较次要,但可参考选择,A2优于A1优于A3,故综合考虑因素A 应当选择A2 因素B :在两个指标中都处于同一地位,于Fe 2O 3含量应选择B2=B3,最好不要选择B1,于
Fe 2O 3分布率,B3优于B2优于B1,故综合考虑应选择B3
因素C ,Fe 2O 3含量更重要,C3优于C2优于C1,又从Fe 2O 3分布率看C1优于C2优于C3,综合考虑应选择C2
因素D :分布率中最重要,D1>D2>D3, 含量中最次要:D3=D1>D2,可当作参考,故选择D1 综上所述,试验后确定出如下的优化生产条件:A2B3C2D1 再来一个例子:油泵柱塞组合件收口强度稳定性试验
例:某厂生产的油泵柱塞组合件是经过机械加工、组合收口、去应力等工序制成的。试验前产品的拉脱力波动较大,且拉脱力与转角两指标往往相互矛盾。本试验的目的是通过对产品结构尺寸的优化来达到提高产品质量的目的。为此,确定三个试验指标:拉脱力F ≥1000N (望大);轴向游隙δ≤0. 02m m (望小);转角α≥20(望大)。
13
● 明确试验目的,确定试验指标
拉脱力F ≥1000N ,望大)轴向游隙δ≤0. 02m m ,望小) 转角α≥20 ,望大) ● 确定试验因素,选择因素水平
由实践经验得知,柱塞头的外径D 、高度L 、倒角K ×β以及收口压力p 四个因素对试验指标产生主要影响,故考查这四个因素,每个因素取三水平。
因素
A 柱塞头外径D (mm )
15.115.314.8
B 柱塞头高度L (mm )
11.611.811.7
C
柱塞头倒角K ×β(mm ×°)
1.0×30°1.5×30°1.0×30°
D 收口压力p (MPa )
1.51.72.0
水平
123
● 选择正交表,设计表头
本试验属四因素、三水平试验,故选用正交表L 9(34),表头见后 ● 根据正交表设计试验方案,进行试验,收集试验数据 为提高试验精度,减小试验误差的影响,对每种水平搭配进行7次重复试验,然后分别取F 、
δ、α的7次平均值作为试验分析的数据。为简化计算,还对原始数据进行了适当的转换。
● 对各指标的试验数据分别进行计算(同单指标),并进行直接分析和计算分析
试验方案
因素
列号试验号123456789
112 (15.3)223 (14.8)33
A 11 (15.1)
B 21 (11.5)2 (11.8)3 (11.7)123123
C 31 (1×50°) 2 (1.5×30°) 3 (1×30°) 231312
D 41 (1.5)2 (1.7)3 (2.0)312231
拉脱力F i ’(N )-30366-15.651-1-689119T=88.5
试验结果轴向游隙δi ’(mm )[***********]T=390
转角α’(°)25.5-1.017.521.5-10.026.518.50.5-4.5T=94.5
说明:F i ' =
7
(i -900),δi ' =7000(i -0. 01),αi ' =7(i -20) 10
i ,i ,i 分别为各指标7次重复试验结果数据的平均值。
14
◆ 计算指标拉脱力F ’对应于同一因素水平的R 。
12
411.514
10
9515913631.75345.321.3423814.51412.74.89.2
-37.859.38
47.1
[***********].5-10.539.521.8-3.513.225.3
2013.2-3.7
23.7
9711018332.336.66128.752.5162617.55.38.712.2
13.3-1127.2
拉脱力F ’
3
R
K 1
38.2
[1**********]3.728.339.7114439.53.714.713.211
轴向游隙δ'
K 2K 3
123
R K 1K 2
转角
K 3123
α'
R
◆ 画出趋势图,按极差大小排出主次因素。
拉脱力(主) B →D →C →A (次)轴向游隙(主) B →D →C →A (次) 转角(主) B →C →D →A (次)
由于转角对应于因素C 、D 的极差相差不大,故综合考虑将二者的次序调换,将影响整个组件三个指标的主次顺序认定为(主) B →D →C →A (次) ◆ 初选最优生产条件。 对于拉脱力:(望大)A3B2C1D3;对于轴向游隙(望小)A1B1C1D3 对于转角:(望大)A1B1C1D2
◆ 综合平衡,选取最优生产条件。
因素C :对三个指标来说均是C1最好,故选C1; 因素B :对三个指标来说B 均为主要因素(极差最大),一般情况下倾向于选B1,但因F 是该部件的主要参数,故实际选用B2;
因素D :对转角来说,D 是较次要因素,故D2将改选为D3,综合平衡后选D3; 因素A :对三个指标来说A 皆为次要因素,按多数倾向选取A1。 综上所述,试验后确定出如下的优化生产条件:A1 B2 C1 D3 2. 综合评分法
对多指标一一进行测试后,按照具体情况确定评分标准,对这些指标进行综合评分,将多指标问题转化为单指标问题,进而得到多指标试验的结论。综合评分方法主要有: ● 排队综合评分法● 加权综合评分法● 公式综合评分法 3 有交互作用的直观分析
15
现代数学方法讲稿
第一部分:现代实用统计方法
第一章:正交设计的基本知识(Orthogonal Design ) 1.1试验设计概述 试验与试验设计
所谓试验,一般指用于发现新的现象、新的事物、新的规律,以肯定或否定先前的调查研究结论、发现新规律而进行的有计划活动。试验的实质:是一种用以测定过程或系统某些特定性能的有目的的测试。
试验设计是数理统计学领域的一个分支。它是以概率论、数理统计、线性代数等为理论基础,科学地设计试验方案,正确合理地分析试验结果,以较少的试验工作量和较低的成本获取足够、可靠的有用信息。
试验设计的主要研究内容:
◆ 哪个因素对指标值影响较大?如何影响?
◆ 如何设置各因素的水平,使指标值接近预期的期望值? ◆ 如何设置各因素的水平,使指标值的方差(波动)最小?
◆ 如何设置可控因素的水平,使非可控因素的影响最小?„„ 试验设计的发展历史
试验设计的基本思想和方法是英国统计学家、工程师费歇尔(R.A.Fisher ,1890~1962)于20世纪20年代创立的,他是试验设计的奠基人并对其后的发展做出了卓越的贡献。 试验设计与分析的发展大致可划分为三个历史阶段。 早期、传统试验设计阶段(约1920s~1950s) 费歇尔在农场进行田间试验的过程中,对高产小麦品种遗传进行研究。为减少偶然因素对试验的影响,他对各种试验因素的每一水平组合进行了试验,并通过方差分析评价指标的优劣(用于排除偶然因素的影响),使小麦大幅度增产。 ◆ 1925年,费歇尔在《研究工作中的统计方法》一书中首次提出了“实验设计”的概念; ◆ 1935年,费歇尔出版了著名的《试验设计法》一书; ◆ 40年代前后,英、美、苏等国家将试验设计逐渐应用于工业生产领域及军工生产领域; ◆ 劳尼于40年代提出的多因素试验的部分实施方法后来成为现代试验设计理论的基础。 中期发展阶段(约1950s~1970s,以正交试验设计、回归试验设计为代表)
◆ 40年代末、50年代初,以田口玄一(1924--)为代表的日本电讯研究所(EOL )的研究人员在研究电话通讯设备质量时从英、美引进了试验设计技术,提出了“正交试验设计法”; 该所的产品——线形弹簧继电器,有几十个特性值和两千多个试验因素,经7年研制成功,其性能比美国的同一产品更优。虽然其成本仅几美元,研究费用却用了几百万美元,创造的经济效益高达几十亿美元!同时挤垮了美国的企业。 ◆ 50年代初,创立了“回归试验设计法”;
◆ 1957年,田口玄一又提出了“信噪比(S/N)试验设计”;
二战后日本经济迅速发展的原因之一就是在工业领域普遍推广和应用正交试验设计和产品三次设计,因此在日本把正交试验设计技术称为“国宝”。 ◆ 1959年,G.E. 博克斯和J.S. 亨特尔提出了调优操作(EVOP ),也称为调优试验设计法; ◆ 70年代中期,田口玄一提出了“产品三次设计”。 ● 现代试验设计阶段(1970s~)
◆ 自70年代开始,S/N试验设计及产品三次设计开始了实质性的应用; ◆ 80年代,我国学者方开泰(南开大学)创立了“均匀试验设计”;
◆ 80年代开始,田口提出走质量工程学的道路,编著了《质量工程学》丛书,将质量管理、质量控制与试验设计结合起来,使试验设计发展到了一个新的水平。 试验设计发展的三个里程碑:
◆ 费歇尔创立了早期、传统的试验设计理论、方法; ◆ 正交表的开发及正交实验设计的应用; ◆ 信噪比试验设计和产品三次设计的应用。 我国试验设计的发展情况:
◆ 50年代开始研究;◆ 60年代提出观点;
◆ 70年代开始实质应用;◆ 80年代提出均匀试验设计理论。 1.2正交设计的基本概念 正交试验设计(Orthogonal Design )是于二十世纪50年代初期,由日本质量管理专家田口玄一(Tachugi )博士提出的在多因素试验设计方法的基础上,进一步研究开发出来的一种试验设计技术。
正交试验设计法使用一种规范化的表格(正交表)进行试验设计,可以用较少的试验次数,取得较为准确、可靠的优选结论。正交试验设计的基础是正交表。 (1) 试验指标(简称指标)
根据试验目的所选定的、用来考察试验结果的特性值。 ● 按指标的性质分
★ 定量(数值)指标:用数值表示特性值的指标(如重量、强度、精度、寿命、成本等)。 ★ 定性(非数值)指标:不能用数值表示特性值的指标(如光泽、颜色、味道、手感等)。 注意:◆ 每个指标唯一表示一种特性(性质、状态),某一试验过程中不能用多个指标重复表示同一种特性。 ◆ 试验指标应尽可能采用定量(数值)指标(如重量、成本、寿命等)。对于定性指标在实际中为便于分析,也常划分成几个不同等级从而定量化,如颜色可一一对应于数字,从而定量化。0、1数据(如合格与否、电路的通与断等)。 ● 按试验指标的数量分
★ 单指标:试验指标只有一个。★ 多指标:试验指标只有多个。 (2)试验因素(简称因素)
对试验结果(特性值)可能有影响的原因或要素。如在生产中考虑指标:产量,则影响产量的因素可能有温度A ,时间B ,化学催化剂用量C 等,常用大写英文字母A 、B 、C„等表示。 ★ 可控因素:人可以控制、调节的因素(如加热温度、切削速度等)。
★ 不可控因素:人不可控制、调节的因素(如机床的随机振动、试验中的随机误差等)。 注意:试验设计中主要考虑可控因素,不可控因素的影响通过数据处理来处理。实际中因素变化都是在一个范围内变化,此时应选择几个具有代表性的值来表示因素的不同影响,这些值就为
(3)因素的水平
试验中因素变化的状态和条件称为因素的水平或位数,简称水平。因素A 的水平用代表因素的字母加下标表示,记为A1,A2,„Ak
在实验中如何去选择因素和水平关系到试验能否成功(有效)的关键,那么如何去选择呢? 让我们先看一个例子:
例1 在一个化工生产过程中,考虑影响得率(产量)的三个因素:温度(A),时间(B)和加碱量(C)。为了便于试验的安排,每个因素要根据以往的经验来选择一个试验范围,然
后在试验范围内挑出几个有代表性的值来进行试验,这些值称做该因素的水平。在该例中,我们选择的试验范围如下:
温度: 77.5℃~92.5℃时间: 75分~165分加碱量: 4.5%~7.5% 然后在上述范围内,每个因素各选三个水平,组成如下的因素水平表:
选择因素和水平关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计的人员可能是有益的。
1.在一个生产过程中,有关的因素通常是很多的,例如在例1的化工生产工艺中,有催化剂的品种,催化剂用量,加碱时的速度,容器中的压力等。但根据这次试验目的,除了温度(A ),时间(B ),和加碱量(C )各取三个水平外,其余因素是固定的,或者讲,他们只取一个水平。为了方便,通常这些固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。
2.在一项试验中,如何从众多的有关因素中挑选出试验方案中的因素?我们建议课题的领导者应当要请有经验的工程师、技术员、工人共同讨论决定。在一次试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。相反地, 因素也不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的。例如,有这样的故事,原计划试验方案中只有三个因素,而利用试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,既然不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是最重要的,从而发现了历史上最好的工艺条件,正是“有心栽花花不成,无意插柳柳成荫。”
3.试验的范围应当尽可能大一点。如果试验在试验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不易获得比已有条件有显著改善的结果。历史上有些重大的发明和发现,是由于“事故”而获得的,也就是说试验的范围大大不同于有经验的范围。
4.若试验范围允许大一些,则每一因素的水平个数最好适当多一些。
5.水平的间隔大小和生产控制精度是密切相关的。若在例1中温度的控制只能作到
±3℃, 且我们设定控制在85℃, 于是在生产过程中温度将会在85°±3℃, 即82—88℃波动。不难看到,这时设定的三个水平80℃,85℃,90℃之间是太近了,应当加大,例如80℃,90℃,100℃。如果温度控制的精度可达±1℃, 则例1如设定的三个水平是合理的。 6.因素和水平的含意可以是广义的。例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平
在一次试验中每个因素总取一个特定的水平,称各因素水平的一个组合为一个水平组合或一个试验条件。如A2B2C3。
多因素试验遇到的最大困难是试验次数太多,若十个因素对产品质量有影响,每个因素取两个不同水平进行比较,有210=1024、 如果每个因素取三个不同水平310=59049个不同的试验次数。
在多因素试验中,有人采用“单因素轮换法”,但是这种方法不一定能找到好的结果
譬如:考察两个因素,先固定A 在A1,发现B3好,再固定B3,发现A1好,但是实际上好的条件是A2B2。
B1 B2 B3 A1 50 56 62
A2 56 70 60 A3 54 60 58
选择部分条件进行试验,再通过数据分析来寻找好的条件,这便是试验设计问题。通过少量的试验获得较多的信息,达到试验的目的:发现那些因素对试验结果确有影响,因素的什么水平组合是最好的。
通过合理、科学的试验设计,可以显著提高产品的设计、开发质量,找出最佳的工艺条件,从而提高产品最终的质量。
田口认为,设计质量(包括产品设计和工艺设计)对整个产品质量的贡献约为60%~70%。 试验的主要步骤(阶段)
● 试验设计阶段——选题、设计试验方案、准备试验材料及设备、安排试验环境等; ● 试验实施阶段——按计划进行试验(包括试验操作、收集试验数据等);
● 试验分析阶段——核查试验数据、进行统计分析、解释试验结果、获取试验结论等。 试验设计的基本原则(费歇尔三原则)
● 重复原则——利用重复观测减小试验误差,提高试验精度;
● 随机化原则——目的是为了消除或减小人为因素引起的系统误差的影响;
● 局部控制原则——该原则也称为区组控制原则,指的是把比较的水平设置在差异较小的区组内,其目的也是为了消除或减小试验中系统误差的影响。例如,按机器设备、班次、原料批号、操作人员划分区组。
1.2 试验设计的统计学基础 常用统计量 1.极差
极差指的是一组数据中的最大值与最小值之差,也称为变异幅。R =x m ax -x m in 极差反映了一组数据的最大离散程度。 2. 和与平均值
设有n 个观测值x 1, x 2, xn 构成的一组数据,定义
1n T
和:T =∑x i 平均值 =∑x i =
n i =1n i =1
n
3.偏差(离差)
偏差有以下两种表示方法:
◆ 观测值与期望值μ之差:d i =x i -μ(i =1, 2, , n ) ◆ 观测值与平均值之差:v i =x i -(i =1, 2, , n )
由于期望值通常是未知的,因此试验中常使用后者,前者只用于理论分析中。 注意:
∑v =∑(x
i i =1
i =1
n n
i
-) =0
4. 偏差平方和与自由度
偏差平方和用来表示一组数据的离散程度,通常用S 表示。 存在期望值时:S =
2
2
∑(x -μ)
i
i =1
n
2
不存在期望值时:S =
2
∑(x
i =1
n
i
-) 2
自由度指的是关系式中独立数据的个数,通常用 f 表示。
例如,在计算偏差平方和的过程中,若表达式中使用的是期望值μ ,则 f=n;若表达式中使用的是平均值,则因为存在约束条件
∑(x
i =1
n
i
-) =0而使独立数据的个数少了一个,因
此f=n-1 。
5. 方差与均方差
方差也称为平均偏差平方和,表示单位自由度所对应的偏差大小,通常用 V 表示:
1n 1n 2
V =S /f . 存在期望值时:V =∑(x i -μ) , 不存在期望值时:V =(x i -) 2 ∑n -1i =1n i =1
2
均方差也称为准偏差或标准差,定义为方差的平方根,通常用σ表示,即存在期望值时:
σ==
6. 样本及其分布 总体(population ):被研究对象的全体 样本(sample ):用一定方法从总体中抽取的一组个体称为总体的一个样本。 ※ 与样本有关的几个术语: ● 抽样(采样,取样):从总体抽取样本的过程。
● 随机样本:个体是随机抽取的样本(无特指均认为是随机样本)。 注意:
◆ 由于试验要受到各种条件的限制,通常无法对总体进行研究,而是对某个或某些样本的
1n
(x i -μ) 2不存在期望值时:σ==∑n i =11n
(x i -) 2 ∑n -1i =1
性质进行研究,通过样本来推断总体的特征。 ◆ 总体是随机变量,总体的样本也是随机变量。
◆ 科学实验中的抽样一般要求是完全独立、随机的,且应使每组样本的观测值之间互不影响,以最大限度使样本具有与总体相同的分布规律。 7. 样本统计量
对于给定的一个样本,可以计算其数字特征,并冠以“样本”二字,以示和总体数字特征的区别。例如:
1n
样本的均值=∑x i =m 1,
n i =1
1n n 2'
样本的方差v =
(x -) =m 2∑i
n -1i =1n -1
全厂所有N 个工人的产品质量
从N 个工人中随机抽取n 个工人的产品质量作为样本
每个工人的产品质量仍为随机变量,可能取得不同的观测值
此外还有三大分布和假设检验。这个用到时再来具体谈谈。 1.3正交与正交表 1.3.1正交
在数学上,两个向量A (a 1, a 2, , a n ) 和B (b 1, b 2, , b n ) 若满足
A ∙B =a 1b 1+a 2b 2+ +a n b n =0即两向量的内积等于零,则称此两向量正交。
由于在构造正交表的过程中使用了上述原理,因此将相应的试验设计法称为正交试验设计。 1.3.2正交表
1 完全有序元素对(完全对)
设有两组元素(a 1, a 2, , a n ) 与(b 1, b 2, , b k ) ,它们可构成如下的元素对:
(a 1, b 1),
(a 1, b 2), (a 1, b k )
(1, 1), (3, 1),
(1, 2), (3, 2),
(1, 3) (3, 3)
(a 2, b 1), (a 2, b 2), (a 2, b k ) (a n , b 1), (a n , b 2), (a n , b k )
(2, 1), (2, 2), (2, 3) (4, 1), (4, 2), (4, 3)
称这些元素对为由两元素构成的“完全有序元素对”,简称“元素对”。若元素为数字,则称为“完全有序数字对”。
例:由数字(1,2,3,4)和 (1,2,3)构成的完全有序数字对为: 如上 若在一个矩阵的任意两列中,由两列中的对应元素所构成的数字对是完全对且每对出现的次数相等,则称这两列是均衡搭配,否则就是不均衡搭配。例如:
第I 列 第II 列 第III 列
⎡1⎢1⎢⎢1⎢1A =⎢
⎢2⎢⎢2⎢2⎢⎢2⎣
11221122
1⎤
2⎥⎥1⎥⎥2⎥2⎥⎥2⎥2⎥⎥2⎦⎥
(1, 1)
第I 列与第II 列中的对应元素构成8个数字对:
(1, 1) (1, 2) (2, 1)
(1, 2) (2, 1)
(2, 2) (2, 2)
它们是由元素(1,2)和元素(1,2)构成的完全数字对,每对各出现两次,因此称这两列为均衡搭
配。而第I 列与第III 列、第II 列与第III 列,由于每对出现的次数不相同,因此均为不均衡搭配。
2.正交表的定义与格式
定义:设A 是一个n ⨯k 的矩阵(n 行k 列),其中第 j 列元素由元素(1, 2, , m ) 构成
(j =1, 2, , k ) ,若A 的任意两列均衡搭配,则称A 是一张正交表。例如:L 4(23) 正交表
列号(因素)
行号(试验号)
11122
21212
31212
1234
L 8(4×2) 正交表
列号(因素)
行号(试验号)
4
111223344
212121212
312122121
412211221
512212112
12345678
正交表用符号L n (m 1⨯m 2⨯ ⨯m k ) 表示,其中
L ——正交表的代号,是Latin Square(拉丁方格)的首字母; K ——正交表的列数,每一列对应着一个试验因素; n ——正交表的行数,表示试验的次数;
m j (j =1, , k ) ——第 j 列中元素的个数,表示试验中第 j 个因素所取的水平数。若某些
列中的元素个数相同,可以写成指数的形式。
例如:L 4(2) =L 4(2⨯2⨯2) ,L 8(4⨯2) =L 8(4⨯2⨯2⨯2⨯2) 此外还有三水平表,四水平表和混合水平表。L 164⨯2多安排三个“4”水平因素,六个“2”水平因素。
3
4
(
36
)表示要求做16次试验,允许最
从这些水平表可见正交表的性质
◆ 任意列中各水平重复出现的次数相等。第 j 列中各水平重复出现的次数:t =n /m j ◆ 任意两列所构成的水平对是完全有序数字对,各水平对重复出现的次数相等(均衡搭配)。第 i 列与第 j 列所构成的水平对重复出现的次数:t =n /(m i ⨯m j )(i ≠j )
根据正交表的上述两个性质,可得到正交表的三种初等变换: ◆ 列间置换:正交表中任意两列可以相互交换; ◆ 行间置换:正交表中任意两行可以相互交换;
◆ 水平置换:正交表中任意一列中的水平数字可以相互交换(例如“3”←→“4”)。 (经过上述初等变换后的表仍为正交表,称变换后的正交表为原正交表的等价表) 说明:若用关于零对称的数字表示不同水平(例如二水平用-1、1表示;三水平用-1、0、1表示;四水平用-2、-1、1、2表示),则任意两列元素的内积为零(正交表由此得名)。 用正交表设计出来的试验方案之所以合理,是因为具有如下两个重要的特征: ● 均衡搭配——正交性
可以用较少的试验次数替代全部可能试验组合中好的、中等的、不好的搭配组合,使选出的较少的搭配组合具有均衡的代表性。 ● 综合可比——数据分析的依据
可把复杂的多因素试验数据处理问题转化成单因素试验数据处理。
通过试验数据的适当组合,可发现各组试验数据以及各因素影响之间的某种可比性。 3.正交表的种类
◆ 水平数相同的正交表(m 水平正交表)
此类正交表中m 1=m 2= =m k =m ,因此通常简记为L n (m ) ,如L 4(2) 等。此类正交表又分为两种:
★ 标准型正交表(最常用):水平数为素数或素数整数幂的正交表。例如:
k
3
L 4(23) L 8(27) L 16(215) L 9(34) L 27(313)
★ 非标准型正交表:标准型之外的水平数相同的正交表。 ◆ 水平数不同的正交表
此类正交表中,某两列(或多列)之间的水平数不等。例如:
L 8(4⨯24) L 12(3⨯24) L 16(42⨯29)
4.如何用正交表安排试验 无交互作用的表头设计
若用正交表来安排例1的试验,其步骤十分简单,具体如下:
(1)选择合适的正交表。适合于该项试验的正交表有L 93, L 182⨯3, L 273我们取L 93,因为所需试验数较少。
(2)将A ,B ,C 三个因素放到L 93的任意三列的表头上,例如放在前三列。 (3)将A ,B ,C 三例的“1”,“2”,“3”变为相应因素的三个水平。
()(
4
7
)()等,
13
()
4
()
4
(4)9 次试验方案为:第一号试验的工艺条件为A 1 (80℃) ,B 1 (90分) ,C 1 (5%); 第二号试验的工艺条件为A 1 (80℃) ,B 2 (120分) ,C 2 (6%)„。这样试验方案就排好了。 有交互作用的正交设计 在许多试验中,不仅因素对试验指标单独产生影响,某些因素之间还会联合搭配起来对试验指标产生影响。因素对试验指标的总影响等于各因素单独对试验指标的影响与因素搭配对试验指标的影响之和。因素之间的联合搭配作用称为对试验指标的交互作用。因素A 与B 的交互作用,记为A ×B 或AB 。
例:在大豆试验田内施用氮肥和磷肥,亩产量如下表:
磷肥
氮肥
N1=0N2=6
P1=0
P2=4
400430
450560
交互作用:(560-400)-(450-400)-(430-400) =160-50-30=80(斤) 因素A 与B 的交互作用示意图
12
a. 无交互作用b. 有(正向)交互作用c. 有(反向)交互作用
因素间的交互作用随着因素个数的增加而增加。如四个因素A ,B ,C ,D 间的交互作用有以下几类:
二级交互作用有6个:AB ,AC ,AD ,BC ,BD ,CD 三级交互作用有4个:ABC ,ABD ,ACD ,BCD 四级交互作用1个:ABCD
共有11个,比因素个数还多。实际经验表明,多数交互作用是不存在的或很小以至可以忽略不计,实际中主要考虑部分二级交互作用,具体考察哪些二级交互作用还要依赖专业知识来决定。 L 8(2) 正交表的交互作用表
列号
1
(1)
7
2
3
(2)
3
21
(3)
4
567
(4)
5
4761
(5)
6
74523
(
6)
7
654321
表头设计
正交表的选用原则
基本原则:要考察的因素及交互作用的自由度总和不大于正交表的总自由度。 即: f总≥ fA+ fB+ fC+„+fA × B+fB × C+fA × C+„
注:(1)正交表总自由度f 总=试验次数-1; (2)每因素自由度=各因素水平数-1;( 如:fA =A 的水平数-1)交互作用自由度,如fA ×B = fA × fB
有交互作用时的正交试验设计还应注意:
◆ 交互作用作为单独的一列来处理,但不是一个因素,是两因素的联合搭配。 ◆表头设计的一个重要原则:表头设计时要尽量避免混杂现象的出现。
这是因为,当混杂现象所在列显著时,很难识别是哪个因素(或交互作用)是显著的。混现象:在进行表头设计时,若一列上出现两个因素,或两个交互作用,或一个因素与一个交互作用时,称为混杂现象,简称“混杂”。 ◆ 交互作用只用于试验结果分析,此时把交互作用作为一个因素来对待。
◆ 有时因素的作用不明显,但因素与其他因素的交互作用对试验指标的影响却非常大(此时应特别注意优化水平的确定,否则将对试验指标产生重大的影响)。 给出下列试验的表头设计:
(1)A 、B 、C 、D 为二水平因素,且要考察交互作用A ×B 、A ×C ;
(2)A 、B 、C 、D 为二水平因素,且要考察交互作用A ×B 、C ×D 。
(1)由于因素均为二水平的,故选用二水平正交表,又因素与交互作用的自由度之和为: f A +f B +f C +f D +f A ×B +f A ×C =1+1+1+1+1+1=6
故所选正交表的行数应满足:n ≥6+1=7,所以选L
(27) ,表头设计如下:
(2)由于因素均为二水平的,故仍选用二水平正交表,又因素与交互作用的自由度之和6,故所选正交表的行数应满足:n ≥6+1=7,但L 8(27) 无法安排这四个因素与两个交互作用,因为不管四个因素放在哪四列上,两个交互作用或一个因素与一个交互作用总会共用一列,从而产生混杂,譬如:
p
k
对等水平的完全正交表来讲L n (q ) ,如果n =q ,则全部列被分为k 组,各组的列数分别为q , q , , q 。
如L 8(27) 的列被分成三个组:第一组:第1列:第2、3两列第三组:第4、5、6、7四列 •正交表上有交互作用的两列如果在不同组时,则其交互作用列必在组别高的组中,当有交互作用的两列在同一组时,交互作用必在低组别的组中。
譬如: - 若A 置于第1列,B 置于第2列,则A ×B 为第3列; - 若A 置于第1列,B 置于第4列,则A ×B 为第5列; - 若A 置于第2列,B 置于第3列,则A ×B 为第1列;
- 若A 置于第4列,B 置于第7列,则A ×B 为第3列。
15
当出现混杂现象时,只要选择较大的正交表就可以避免了,譬如选用L 16(2) ,表头设计
1
k -1
(也
715
称为基本列)。如: L 8(2) 的基本列是1,2,4列,- L 16(2) 的基本列是1,2,4,8列。
第三节:正交试验设计的极差分析(直观分析)
直观分析是通过简单地计算各因素水平对试验结果的影响,并用图表形式将这些影响表示出来,再通过极差分析(找出最大值、最小值),最终确定出优化的水平搭配方案(生产方案),或找出因素对试验结果的影响程度。 根据所考查的试验指标的多少,正交试验设计可分为单指标正交试验设计和多指标正交试验设计两种。本节仅讨论单指标正交试验设计的直观分析。 书上例1.3
(1)试验方案设计:设计试验方案时,首先要明确试验要解决的问题(粉状粒),即明确试验指标——粉状粒(越高越好);然后明确影响试验指标的主要因素,选取适当的因素水平。 ■ 明确试验指标和影响因素,制定因素水平表
试验指标:粉状粒, 影响因素:四个,每个因素各选取了三个水平进行试验 ■ 选择正交表,设计表头
根据因素及水平的多少,选择四因素、三水平的正交表L 9(3) ,如下:
因素列号
A 1
B 2
C 3
D 4
4
■ 根据正交表确定试验方案
按正交表L 9(3) 的内容及所设计的表头,将试验方案填入正交表中(如书)
(2)按设计的试验方案进行试验 (3)试验结果的计算与分析
试验结果的计算与分析主要解决以下三个问题(试验的目的): ◆ 分清各因素对试验指标影响的主次顺序;
◆ 找出(确定出)优化生产方案,即确定出采用什么样的因素水平组合才能使试验指标达到最优;
◆ 分析试验因素对试验指标的影响趋势;为进一步试验指明方向。 ■ 直接分析
由试验数据可以直接看出,在#1号试验(A1B1C1D1)的工艺条件下,粉状粒最高。
但这种条件是否就是因素水平的最佳搭配呢?在9种方案之外还有没有更好的水平搭配呢?(本来总共有3 81次实验)1号试验在这9种方案中最优,并不表示在所有方案中是最优的,这需要通过进一步的计算、分析得到最佳的生产条件。 怎么在不增加实验次数条件下来分析呢? ■ 计算分析
其实我们可以通过对这九组原始试验数据的简单计算,确定各因素水平的影响程度,最终找出最佳生产条件。
(1)寻找最好的试验条件
在A1水平下进行了三次试验:#1,#2,#3,而在这三次试验中因素B 的三个水平各进行了一次试验,因素C 的三个水平也各进行了一次试验。
在A2水平下进行了三次试验:#4,#5,#6,在这三次试验中因素B 与C 的三个水平各进行了一次试验。
在A3水平下进行了三次试验:#7,#8,#9,在这三次试验中因素B 与C 的三个水平各进行了一次试验。
4
4
11
将全部试验分成三个组,那么这这三组数据间的差异就反映了因素A 的三个水平的差异,为此计算各组数据的和与平均:K i ,i ;i=1,2,3(
同理, 对因素B 与C ,D 将数据分成三组分别比较 2)各因素对指标影响程度大小的分析
分析:由于指标要求是粉状粒最高越好,因此由于在因素A 下水平A1下的数据之和最大,故因素A 的第一个水平最优。并且可见A1优于A3优于A2。同理可见: B1优于B2优于B3,C ,D 也同理。
注意:若指标要求越小越好,则水平和或水平均值越小的越好。
上面说明了因素水平哪个最优,分清了各因素对试验指标影响的主次顺序;找出(确定了)优化生产方案,即确定出采用什么样的因素水平组合才能使试验指标达到最优;还有第三个目的没有实现。
(3)各因素不同水平对指标的影响图
极差的大小反映了因素水平改变时对试验结果的影响大小。这里因素的极差是指各水平平均值的最大值与最小值之差,譬如对因素A 来讲:RA =37.0-27.7=9.3其它的结果也列在书上由此可画出试验因素与试验指标关系的趋势图(以各因素的水平为横坐标,以相应水平下的 水平均值为纵坐标)。
根据正交表的综合可比性,由上述计算及趋势图可分析得出以下结论: 按极差计算结果确定主次因素(极差越大,影响越主要)
也可观察趋势图确定主次因素(点子升、降的幅度越大,影响越主要)
可见RB 大于RA 大于RD 大于RC ,从而四因素中因素B 是对指标影响最大的,是主要(最显著)因素。
直接分析结果与后面计算分析结果的比较 直接分析的结果:A1B1C3D1。
◆ 直接分析的结果反映的是正交表中9次试验中的最优水平搭配,但不一定是所有可能的水平搭配(34=81种)中最优的。
◆ 为了展望或寻求更好的搭配,可使用计算分析,通过对趋势的观察,可以找出比直接分析结果更好的水平搭配。
计算分析的结果有时也可能不如直接分析合理,其主要原因可能是:
◆ 试验误差过大; ◆ 存在其它影响因素而未加以考虑;◆ 因素水平选取不当。
第四节:多指标正交试验设计
实际工作中存在着大量的多指标工业试验。在这类试验的设计中,设计与分析较单指标要复杂,各指标之间可能会出现一些矛盾,如何兼顾这些指标呢? 多指标试验设计常用的方法主要有两种: ◆ 综合平衡法 ◆ 综合评分法 1. 综合平衡法
综合平衡法是一种先对每一指标分别进行分析,找出一些较满意的水平组合,再与实际情况相结合,综合考虑各个指标之间关系,最后得出一个或几个较为满意的水平组合的方法。 例见书1.4
● 明确试验目的,确定试验指标
精泥产率(望大),精泥中Fe 2O 3含量(望小),精泥中Fe 2O 3分布率(望小)
12
∑K
i
=T , T 为9次试验的偏差之和)
● 确定试验因素,选择因素水平
由实践经验得知,有四个因素对试验指标产生主要影响,故考查这四个因素,每个因素取三水平。
● 选择正交表,设计表头
本试验属四因素、三水平试验,故选用正交表L 9(34),表头见后。 ● 根据正交表设计试验方案,进行试验,收集试验数据 对每种水平搭配进行试验,得到实验数据
● 对各指标的试验数据分别进行计算(同单指标),并进行直接分析和计算分析
计算指标对应于同一因素水平的水平均值,极差,画出趋势图,按极差大小排出主次因素。 结果:精泥中Fe 2O 3含量(望小)(主) A→B →C →D (次) 精泥中Fe 2O 3分布率(望小)(主)D →B →A →C (次) ◆ 初选最优生产条件。
精泥中Fe 2O 3含量:A3B23C3D13;精泥中Fe 2O 3分布率:A2B3C1D1
但这些都只是单个指标下最优水平组合,在同时考虑这两个指标时,显然上面两个都不一定是最优的组合,那么到底如何去寻找一个适当的对两个指标来说都比较好,对整体来说最优的水平组合呢?
◆ 综合平衡,选取最优生产条件。
先按指标中处于主要地位的因素考虑其较为好的水平,再由别的指标中次要地位的因素来 选取其相对来说最好的水平。
因素A :对指标精泥中Fe 2O 3含量来说A 为最主要因素,故最先考虑,最好是选取A3,其次应选取A2,最不好的是A1。而对指标精泥中Fe 2O 3分布率(望小)而言,因素A 处于三号位置,较次要,但可参考选择,A2优于A1优于A3,故综合考虑因素A 应当选择A2 因素B :在两个指标中都处于同一地位,于Fe 2O 3含量应选择B2=B3,最好不要选择B1,于
Fe 2O 3分布率,B3优于B2优于B1,故综合考虑应选择B3
因素C ,Fe 2O 3含量更重要,C3优于C2优于C1,又从Fe 2O 3分布率看C1优于C2优于C3,综合考虑应选择C2
因素D :分布率中最重要,D1>D2>D3, 含量中最次要:D3=D1>D2,可当作参考,故选择D1 综上所述,试验后确定出如下的优化生产条件:A2B3C2D1 再来一个例子:油泵柱塞组合件收口强度稳定性试验
例:某厂生产的油泵柱塞组合件是经过机械加工、组合收口、去应力等工序制成的。试验前产品的拉脱力波动较大,且拉脱力与转角两指标往往相互矛盾。本试验的目的是通过对产品结构尺寸的优化来达到提高产品质量的目的。为此,确定三个试验指标:拉脱力F ≥1000N (望大);轴向游隙δ≤0. 02m m (望小);转角α≥20(望大)。
13
● 明确试验目的,确定试验指标
拉脱力F ≥1000N ,望大)轴向游隙δ≤0. 02m m ,望小) 转角α≥20 ,望大) ● 确定试验因素,选择因素水平
由实践经验得知,柱塞头的外径D 、高度L 、倒角K ×β以及收口压力p 四个因素对试验指标产生主要影响,故考查这四个因素,每个因素取三水平。
因素
A 柱塞头外径D (mm )
15.115.314.8
B 柱塞头高度L (mm )
11.611.811.7
C
柱塞头倒角K ×β(mm ×°)
1.0×30°1.5×30°1.0×30°
D 收口压力p (MPa )
1.51.72.0
水平
123
● 选择正交表,设计表头
本试验属四因素、三水平试验,故选用正交表L 9(34),表头见后 ● 根据正交表设计试验方案,进行试验,收集试验数据 为提高试验精度,减小试验误差的影响,对每种水平搭配进行7次重复试验,然后分别取F 、
δ、α的7次平均值作为试验分析的数据。为简化计算,还对原始数据进行了适当的转换。
● 对各指标的试验数据分别进行计算(同单指标),并进行直接分析和计算分析
试验方案
因素
列号试验号123456789
112 (15.3)223 (14.8)33
A 11 (15.1)
B 21 (11.5)2 (11.8)3 (11.7)123123
C 31 (1×50°) 2 (1.5×30°) 3 (1×30°) 231312
D 41 (1.5)2 (1.7)3 (2.0)312231
拉脱力F i ’(N )-30366-15.651-1-689119T=88.5
试验结果轴向游隙δi ’(mm )[***********]T=390
转角α’(°)25.5-1.017.521.5-10.026.518.50.5-4.5T=94.5
说明:F i ' =
7
(i -900),δi ' =7000(i -0. 01),αi ' =7(i -20) 10
i ,i ,i 分别为各指标7次重复试验结果数据的平均值。
14
◆ 计算指标拉脱力F ’对应于同一因素水平的R 。
12
411.514
10
9515913631.75345.321.3423814.51412.74.89.2
-37.859.38
47.1
[***********].5-10.539.521.8-3.513.225.3
2013.2-3.7
23.7
9711018332.336.66128.752.5162617.55.38.712.2
13.3-1127.2
拉脱力F ’
3
R
K 1
38.2
[1**********]3.728.339.7114439.53.714.713.211
轴向游隙δ'
K 2K 3
123
R K 1K 2
转角
K 3123
α'
R
◆ 画出趋势图,按极差大小排出主次因素。
拉脱力(主) B →D →C →A (次)轴向游隙(主) B →D →C →A (次) 转角(主) B →C →D →A (次)
由于转角对应于因素C 、D 的极差相差不大,故综合考虑将二者的次序调换,将影响整个组件三个指标的主次顺序认定为(主) B →D →C →A (次) ◆ 初选最优生产条件。 对于拉脱力:(望大)A3B2C1D3;对于轴向游隙(望小)A1B1C1D3 对于转角:(望大)A1B1C1D2
◆ 综合平衡,选取最优生产条件。
因素C :对三个指标来说均是C1最好,故选C1; 因素B :对三个指标来说B 均为主要因素(极差最大),一般情况下倾向于选B1,但因F 是该部件的主要参数,故实际选用B2;
因素D :对转角来说,D 是较次要因素,故D2将改选为D3,综合平衡后选D3; 因素A :对三个指标来说A 皆为次要因素,按多数倾向选取A1。 综上所述,试验后确定出如下的优化生产条件:A1 B2 C1 D3 2. 综合评分法
对多指标一一进行测试后,按照具体情况确定评分标准,对这些指标进行综合评分,将多指标问题转化为单指标问题,进而得到多指标试验的结论。综合评分方法主要有: ● 排队综合评分法● 加权综合评分法● 公式综合评分法 3 有交互作用的直观分析
15