第十章方差分析与正交试验设计



《第十章方差分析与正交试验设计》由会员分享,可在线阅读,更多相关《第十章方差分析与正交试验设计(24页珍藏版)》请在文档大全上搜索。
1、第十章方差分析与正交试验设计方差分析与试验设计是英国统计学家和遗传学家费希尔进行农业试验发展起来的通过试验获取数据并进行分析的统计方法。方差分析讨论的是生产和科学试验中有哪些因素对试验结果有显著作用,哪些因素没有显著作用。讨论的是一个因素对试验结果是否有影响称为一元方差分析,讨论的是多个因素对试验结果是否有影响称为多元方差分析.对于因素多于两个的方差分析,公式变得相当复杂,试验次数较多,我们介绍一个试验次数少的试验设计方案,正交试验设计。10.1一元方差分析人们常常通过试验来考察了解各种因素对产品或成品的性能,成本、产量等的影响,我们把性能、成本、产量等统称为试验指标。有些指标可以直接用数量表
2、示,称为定量指标;不能直接用数量表示的,称为定性指标,可按评定结果打出分数或评出等级,这时就能用数量表示了。在试验中,影响试验指标的原因称为因素。因素在试验中所处的各种状态称为因素的水平,某个因素在试验中需要考察它的几种状态,就称它为几水平的因素。在生产实践和科学试验中,人们经常要研究这样的问题:如果改变生产条件是否会对产品(指标)产生显著影响?如果改变试验条件是否会对试验结果(指标)产生显著影响?方差分析的作用就在于通过对试验数据的统计分析,从而推断试验数据间的差异是由于生产条件的改变还是由于随机误差的影响,并分析出最佳的试验条件。为此弄清楚方差分析处理问题的基本思想,下面举例说明。例某灯泡
3、厂用四种不同配料方案制成的灯丝生产四批灯泡,在每批灯泡中取若干个做寿命试验,它们的寿命分别记为Xj,其中下标i表示第i批灯泡,第二个下标j表示第j次试验。具体数据如下表四批灯泡的寿命试验表品种寿命(小时)A1600,1610,1650,1680,1700,1720,1800A1580,1640,1640,1700,1750A1460,1550,1600,1620,1660,1740,1820,1640A1510,1520,1530,1570,1600,1680现在要研究的问题是灯丝的不同配料方案,即不同的品种对灯泡寿命有无显著影响。在这里灯泡的寿命就是指标,灯泡品种就是因子,四种不同品种的灯泡
4、就是四个水平,因此这是一个单因子四水平试验。我们将每一种配料制成的灯泡,其寿命看成同一总体,而不同品种的灯泡就是不同总体,因而出现四个不同总体。每一种的灯泡寿命都有一个理论上的平均值,即分布的数学期望,不同品种的灯泡的寿命的数学期望可能有显著差异,也可能没有显著差异,试验的目的就是通过假设检验对这个问题给出一个推断。一般可假定母体的方差相同。由于其他试验条件相同,如果灯泡品种对灯泡寿命无显著性影响,我们可认为四个总体的概率分布相同,换句话说,灯泡品种对灯泡寿命是否有显著性影响,就是要检验四个总体的均值是否相等.按参数估计的假设检验方法可以逐个地进行检验,但这个方法显得繁而复杂.特别当水平数较多
5、时,需要做许多假设和检验,计算量也相当大.如果能导出一个可以用来检验所有这些假设的统计量,那么解决这样的冋题就方便多了。方差分析就是解决这样的冋题.假设试验只考虑一个因素A,它有I个水平Ai,A,,A,总共有N次试验,Xj表示第i水平第j次试验,其数据如下表表一元方差试验数据表水平试验结果A1A2AiX11,X12,X1X21,X22,X2n2X|1,X|2,Xln|我们再作如下假设:Xi,X2,X|为I个子总体,且Xi,X2,X|相互独立,XN(,;2),而冷兀2,,乂刖为Xi的样本。显然I个水平对试验结果有无显者性影响,就是看Xi,X2,X|是否为相同的总体,或它们的分布是否相同。由于它们
6、都是正态总体,就只要看它们分布的参数是否相同,已知方差相同,这就只须判断数学期望是否相等。换句话说,只要在一定的显著性水平上检验统计假设H。:1niXiXij,nij壬niXpU分别表示第i个子总体的样本均值(组平均值)和总体样本均值(总平均值)。总偏差平方和IniSST八x(Xj-X)2j电它描述全部数据离散程度(总波动)的大小。容易证明SST=SSA+SSE(10.1.1)I_Ini其中SSA八ni(X?-X)2,SSE;二(Xj-X)2ITijdSSA反映的是各子总体样本均值(组平均值)的不同而引起的误差,是各组平均值与总体样本平均值的离差平方和,它表示因试验水平差异带来的误差大小,称为
7、组间偏差平方和,也称为系统误差。SSE反映的是每一个子总体的(组内)数据不同而引起的误差,是每个观测值与其组内平均值的离差平方和,它表示试验误差的大小,称为组内偏差平方和,也称为误差平方和。因此,通过SSA的大小可以反映原假设Ho是否成立。若SSA显著地大于SSE,说明各子总体(水平)Xi之间差异显著,那么H。可能不成立。这种比较方差大小来判断原假设H。是否成立的方法就是方差分析的由来。那么吏A的值大到什么程度可以否定H。呢?在SSE理论上已经证明SSA/(I_1)SSE/(N-I)SSA/(I_1)SSE/(N-I)F(I-1,N-I)(10.1.2)统计量F可以作为判断H。是否成立的检验统
8、计量。在给定显著水平:的情况下,当F.F:.(l1,N-I)时,贝U拒绝H。,认为因素A对试验的指标是显著的,否则接受Ho。在实际进行一元方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表表一元方差分析表在例中给定-0.05,问灯丝的配料方案对灯泡寿命有无影响。方差来源平方和自由度样本方差F值组间(因素A)SSAI-1SSA/(I_1)SSA/(I-1)组内(误差)SSEN-1SSE/(N-I)SSE/(N-1)总和SSTN-1解按题意丨=4,山=7,门2=5,门3=8,帀=6,N=26,经计算可得下列方差分析表表例的方差分析表方差来源平方和自由度样本方差F值组间(因素
9、A)44374.6314791.52.17组内(误差)1449970.8226816.8总和194345.425对给定的。=0.05,查表得F°.05(3,22)=3.05,因为F=2.15£F°.05(3,22),所以接受H。,即这四种灯丝的配料方案生产的灯泡寿命之间无显著差异,换句话说,配料方案对灯泡寿命没有显著影响。10.2二元方差分析.无重复试验的方差分析如果两个因子无交互作用,只需在各种组合水平下各作一次试验就可进行方差分析,称为无重复试验的方差分析。在上一小节中,我们假定对两个因子的每个水平组合都重复1次,则将既没有误差平方和,也没有自由度来刻画随机误
10、差。此时,因子效应的大小将失去比较的依据,从而也无法进行F检验因此,对双因子无重复试验数据,只有采用简化的模型,才能进行方差分析.由于是无重复试验,可将数据重新记为Xij(i=1,,|,j=1,J),它表示A的第i水平和B的第j水平的指标值。假设诸Xj之间相互独立,且XjN(j,;2),则Xjj-心为,其中呵之间相互独立,且;jjN(0,;")。类似上一小节的讨论,得到数学模型:Xj"+8+冋+引引N(0,<i2),且各引相互独立(10.2.1)IJ送=0,£Pj=0在上述表达式中,了表示总均值,:i表示A因子的第i水平对指标的单独效果,称为A因子的主效应,
11、'表示B因子的第j水平对指标的单独效果,称为B因子的主效应。A因子的主效应水平是否显著,对此可以检验假设:Hr:為-:2=:丨=°(10.2.2)B因子的主效应是否显著,则可以检验假设:H2:二。(10.2.3)总体样本均值、A的第i水平样本均值和B的第j水平的样本均值分别为11X=-XXjijIiA(10.2.4)11JXP:-Xj,可以证明SST二SSA+SSE+SSE其中IJ_总偏差平方和2SST八'(Xj-X)i=1j4A因子偏差(主效应)平方和:I_SSA二广(Xj.-X)2,iAJ一B因子偏差(主效应)平方和:SSB=|v(X.j-X)2u随机误差平方和: