
《第二章 生物统计基础知识 3 假设检验》由会员分享,可在线阅读,更多相关《第二章 生物统计基础知识 3 假设检验(62页珍藏版)》请在文档大全上搜索。
1、统计假设检验Hypothesis testing in statistics统计假设检验统计假设检验 Statistical hypothesis testing假设检验假设检验(Testing of hypothesis)(Testing of hypothesis)或统计检验,也称为或统计检验,也称为显著性检验显著性检验(Tests of significance)(Tests of significance)。含义含义 ImplicationImplication: 是对不同样本之间的差异是否显著,或试验的效应能是对不同样本之间的差异是否显著,或试验的效应能否确立否确立( (不同处理间的
2、差异是否显著不同处理间的差异是否显著) ),所进行的一种数学,所进行的一种数学推断。推断。显著性检验的目的就在于承认并尽量排除这些无法控制的显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰,将处理间是否存在本质差异揭示出来偶然因素的干扰,将处理间是否存在本质差异揭示出来。一、统计假设一、统计假设 Statistical hypothesis1. 基本概念基本概念 Basic concept是对样本之间差异的显著性所做的是与否的假定;是对样本之间差异的显著性所做的是与否的假定;是对两个样本或多个样本的来源是否一致所做的假定;是对两个样本或多个样本的来源是否一致所做的假定;是对两个
3、样本或多个样本间差异的来源所做的假定。是对两个样本或多个样本间差异的来源所做的假定。统计假设统计假设 Hypothesis in statistics假设的种类假设的种类 Types of hypothesis备择假设备择假设 Alternative hypothesis(记作(记作 HA ):):含义含义:假定样本统计值之间的差异和波动不是由:假定样本统计值之间的差异和波动不是由试验误差试验误差引起的,而是存在本质差异。引起的,而是存在本质差异。零值假设零值假设 Null hypothesis (记作(记作 H0 ) : 亦称亦称无效假设无效假设或解消假设或解消假设。 含义含义:假定样本统计
4、值之间的差异和波动是由试验误差引起:假定样本统计值之间的差异和波动是由试验误差引起的,它们来自同一总体,无本质差别。的,它们来自同一总体,无本质差别。二者是对立事件,一起构成完全事件系。二者是对立事件,一起构成完全事件系。H H0 0 成立,则否定成立,则否定 H HA A,称为差异不显著;,称为差异不显著;H H0 0 被否定,则接受被否定,则接受 H HA A,称为差异显著。,称为差异显著。H0 与与 HA 的关系的关系 Relationship between H0 and HA: 在显著性检验中,否定或接受无效假设的依据是在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能
5、性原理小概率事件实际不可能性原理”。 小概率事件在一次试验中,几乎是不会发生的,小概率事件在一次试验中,几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中竟然发生了,则可认为率很小,而在一次试验中竟然发生了,则可认为假设的条件不正确。因此,否定假设。假设的条件不正确。因此,否定假设。显著水平 significance level 用来确定否定或接受无效假设的概率标准叫用来确定否定或接受无效假设的概率标准叫显著显著水平。水平。 记作记作,越越小小 ,显著性水平越,显著性水平越高,在生物学研究中常高,在生物学研究中常取取=0
6、.05=0.05或或=0.01=0.01。 =0.05=0.05称为称为5%5%显著水平,显著水平, =0.01=0.01称为称为1%1%极显著水平极显著水平若若| |t t|0.050.05 。在在计算所得的计算所得的t t值的右上方标记值的右上方标记“nsns”或不标记符号或不标记符号假设方法假设方法 Method of hypothesis2. 对两个平均数的假设对两个平均数的假设例例2 : 在同一田块种植玉米,重复在同一田块种植玉米,重复5次。肥料次。肥料A:产:产 量量 500 kg/亩;亩; 肥料肥料B:产量:产量520 kg/亩。亩。 问:肥料问:肥料B的效果是否比的效果是否比
7、A 好好? H0 : HA : 1. 对单个平均数的假设对单个平均数的假设例例1 : 某地一般小麦品种产量为某地一般小麦品种产量为 360 kg/亩亩,标准差为,标准差为40 kg/亩,亩,引进品种引进品种在在 10 个田块种植,平均产量为个田块种植,平均产量为 380 kg/亩。亩。问:引进品种是否比原来的品种好?问:引进品种是否比原来的品种好? H0 : = 360 kg/亩;亩; HA : 212100随机抽测10株油松苗木和10株樟子松苗木的高度(cm),数据见下表苗木高度(苗木高度(cm)油松油松111191210131381013樟子松樟子松81112109889107经计算,得油
8、松苗木平均经计算,得油松苗木平均高高 x1=11cm,标准差,标准差S1=1.76 cm;樟子松苗木平均高;樟子松苗木平均高 x2=9.2 cm, 标标 准差准差S2=1.549 cm。 能否仅凭这两个平均高的差值 - =1.8,立即得出两树种苗木高度不同的结论呢?1x2x?显著性检验显著性检验的原理的原理 通过试验测定得到的每个观测值 ,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即 = + 总体平均数 反映了总体特征, 表示误差。nx1x2x , , ,ixiixixi 若 样本含量 为n ,则 可 得 到 n 个 观 测值 。于是
9、样本平均数 nnxxii/)( 说明说明样本平均数并非总体平均数,它还包含试验样本平均数并非总体平均数,它还包含试验误差的成分。误差的成分。 说明样本平均数并非总体平均数,它还包含试验误差的成分。 对于接受不同处理的两个样本来说,则有:)()(212121 xx 这说明两个样本平均数之差( - )也包括了两部分:一部分是两个总体平均数的差( - ),叫 做 试 验 的 处 理 效 应(treatment effect);另一部分是试验误差( - )。1x2x1212(二)显著性检验的基本步骤1 1、首先对试验样本所在的总体作假设、首先对试验样本所在的总体作假设 121 = 或或 -2= 01
10、1、先假设、先假设: : 即假设油松和樟子松苗木高即假设油松和樟子松苗木高度的总体平均数相等度的总体平均数相等2 2、无效假设、无效假设null hypothesisnull hypothesis其意义是试验的表面效应:其意义是试验的表面效应:是是试验误差,试验误差,处理无效,这种假设称为处理无效,这种假设称为无无效假设效假设,记作,记作 : 或或0H021213 3、备择假设、备择假设对对应应假假设设提出提出 H0的同时,相应地提出一对应假设,称的同时,相应地提出一对应假设,称为为备择假设备择假设,记作,记作HA 。备择假设是在无效假。备择假设是在无效假设被否定时准备接受的假设。设被否定时准
11、备接受的假设。亦即存在处理效应,其意义是指试验的表面效应,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。除包含试验误差外,还含有处理效应在内。 对于上述例子,研究在无效假设H0: = 成立的前提下,统计量( - )的抽样分布。经统计学研究,得到一个统计量t:其中: = 叫做叫做平均数的标准差;平均数的标准差;n1、n2为两样本的为两样本的含量。含量。 121x2x2121xxSxxt21xxS)11() 1() 1()()(2121222211nnnnxxxx21xxS2 2、在无效假设成立的前提下,构造合适的统计量,、在无效假设成立的前提下,构造合适的统计
12、量,并研究试验所得统计量的抽样分布,计算无效假设正并研究试验所得统计量的抽样分布,计算无效假设正确的概率确的概率 所得的统计量 t服从自由度 df =(n1-1)+(n2-1)的t分布。 根据两个样本的数据,计算得: - =11-9.2=1.8;1x2x)11() 1() 1()()(212122221121nnnnxxxxSxx742. 0)101101() 110() 110(6 .2128426. 2742. 02 . 9112121xxSxxt 我们需进一步估计我们需进一步估计出出 |t| 2.426的的两侧概率两侧概率,即估计,即估计P(|t|2.426)是多少?)是多少? 查查附表
13、附表3,在,在 df =(n1-1)+ (n2-1) =(10-1)+(10-1)=18时时,两侧概率为,两侧概率为0.05的临界值:的临界值: = 2.101, P(|t|2.101)= P(t2.101)+ P(t 2.878)= P(t2.878) + P(t-2.878)=0.01 )18(05. 0t)18(01. 0t附表三:附表三:t分布临界值表分布临界值表 由于根据两样本数据计算所得的 t 值为2.426,介于两个临界t值之间,即: t0.052.426t0.01 所以,| t |2.426的概率P介于0.01和0.05之间,即:0.01 P 30,可用,可用 代替 。 nxx
14、xu0 样本平均数的标准差样本平均数的标准差 ,亦称样本平均数标准误差,亦称样本平均数标准误差, 简简称标准误差或标准误。称标准误差或标准误。xsxx第第2步步:假定 H0 正确,计算检验所用统计量的值。查正态分布离差值表,当查正态分布离差值表,当 u = 2 时,时,P 介于介于 0.04 0.05之间。之间。1016/40/nx2103603800 xxu二、统计假设检验的基本方法二、统计假设检验的基本方法 P1P2P = P1 + P2第第3步步:根据确定的显著水平:根据确定的显著水平,划出置信区间划出置信区间 Confidence interval 或否定区间或否定区间 Negatio
15、n interval,判断无效假,判断无效假设设 H0 是否成立。是否成立。方法方法1 1:根据小概率原理:根据小概率原理 由于把由于把 P 5%的事件当作不可能事件对待的事件当作不可能事件对待。 由于由于P 30 (大样本)或大样本)或 30 (小小 样本)样本); ; (2) 由非正态总体中抽样由非正态总体中抽样 n 30 (大样本)。大样本)。 所得样本平均数(所得样本平均数( )均属于或接近正态分布。)均属于或接近正态分布。适用范围适用范围 如果,如果, 1 1)2 为已知;为已知; 2 2)2 虽然虽然未知,但未知,但 n 30(大样本)时;(大样本)时; 均可用均可用 u 检验检验
16、来确定来确定 H0:=0 能否成立。能否成立。从以下任一情况下抽样:从以下任一情况下抽样:x 已知大田小麦生长后期不喷磷,千粒重已知大田小麦生长后期不喷磷,千粒重0 = 36.0 g, 2= 6.4 g2;试验表明,喷磷:千粒重;试验表明,喷磷:千粒重 = 37.9 g,n = 10。 问:小麦生长后期叶面喷施磷对千粒重是否有作用?问:小麦生长后期叶面喷施磷对千粒重是否有作用?例例2 第第1步步:提出假设:提出假设H0 : = 0 = 36.0 g;HA :0分析;已知总体方差分析;已知总体方差 ,故可以用,故可以用 u 检验。检验。2x第第2步步:计算:计算u值值第第3步步:推断:推断H0
17、正误正误375. 28 . 00 .369 .370 xxu8 . 0104 . 62nx故可在故可在5%的显著水平上否定的显著水平上否定 H0:= 0 = 36.0 g,接受,接受HA,两者差异达显著水平,小麦生长后期叶面喷施磷能显著增两者差异达显著水平,小麦生长后期叶面喷施磷能显著增加千粒重。加千粒重。由于:由于:96. 105. 0u96. 1u05. 0例例3 3 第第1步步:提出假设:提出假设H0 := 0 = 29.8 mm;HA :0。 已知某棉花品种的纤维长度平均为已知某棉花品种的纤维长度平均为 29.8 mm。从一新品种。从一新品种中以中以 n = 100 抽样,平均纤维长度
18、抽样,平均纤维长度 , ,问问:新品种的纤维长度是否不同于原品种?:新品种的纤维长度是否不同于原品种?分析:总体方差未知,但分析:总体方差未知,但 n 30 ,故可采取,故可采取 u 检验。检验。mmx1 .30mms5 . 1第第2步步:计算:计算 u u 值值第第3步步:推断:推断 H0 正误正误15. 01005 . 1nssx215.08 .291 .30 xsxu此处进行了参数的点估计此处进行了参数的点估计由于由于 1.96 (u0.05) 2.58 (u0.01) ,所以可在,所以可在5%的显著水的显著水平上否定平上否定H0 := 0 = 29.8 mm,接受,接受 HA,两者差异
19、达显著,两者差异达显著水平,新品种的纤维长度显著不同于原品种。水平,新品种的纤维长度显著不同于原品种。u二、 t 检验 t-test1.1.何为何为 t 检验检验?在假设检验中所用在假设检验中所用统计量统计量为为 t,即根据,即根据 t 分布计算概率。分布计算概率。2. t 分布是研究什么的分布是研究什么的?t 分布研究小样本的平均数分布研究小样本的平均数 的概率分布规律。的概率分布规律。实际中用 代替。xxuxsxtnssxx0H12 若t0.05|t| t0.01,则 说明 试验的表面效应属于试验误差的概率P在0.01-0.05之间,即0.01 t0.05 时否定零值假设时否定零值假设,
20、, 否则否则 接受接受 H0 。nxxxsxtnnxxnssx) 1()(22例例第第1 1步步:提出假设:提出假设H0 := 0 = 36 g ; HA :0第第2步步:计算均数标准差计算均数标准差 和和 t 值值已知某水稻品种的千粒重为已知某水稻品种的千粒重为 36 g。现用磷酸二氢钾作喷施。现用磷酸二氢钾作喷施试验。测得试验。测得10个喷施小区的水稻千粒重个喷施小区的水稻千粒重分别为分别为:37,38,36,39,38,39,38,39,37,38 g。问问:喷施钾肥对:喷施钾肥对水稻千粒重是否有作用?水稻千粒重是否有作用?(1 1)总体性质的)总体性质的 t t 检验检验xs05. 6
21、314. 036-9 .37xsxtg314. 0) 1()(22nnxxnssx9 .3710/379nxx第第3步步:推断:推断H0 正误正误 查附表,当查附表,当自由度自由度v =10-1=9时,时,t0.05= 2.262,t0.01=3.250, , 由于由于 t t0.01,所以可在所以可在1%的显著水平上否定的显著水平上否定H0 := 0 = 36g,接受,接受HA,两者差异达极显著水平,施钾能极显著地增,两者差异达极显著水平,施钾能极显著地增加水稻千粒重。加水稻千粒重。例例 对水稻进行等氮量的硫铵,硝铵化肥品种肥效试验,对水稻进行等氮量的硫铵,硝铵化肥品种肥效试验,目的在于了解
22、二者有无差异。试验设计和结果见表目的在于了解二者有无差异。试验设计和结果见表(2 2)比较两个样本的)比较两个样本的 t t 检验检验重复重复硫铵硫铵 X1硝铵硝铵 X2(X1- X1)2(X2- X2)21496.3479.9 222.012.252511.7477.00.251.963522.4495.0125.44275.564514.8465.012.96179.565510.8475.00.1611.56X511.2478.4 360.82470.89表表1 1 硫硫铵和硝铵对水稻的铵和硝铵对水稻的肥效肥效 单位:公斤单位:公斤/ /亩亩 对于上述例子,研究在无效假设H0: = 成立
23、的前提下统计量( - )的抽样分布。经统计学研究,得到一个统计量t:其中: 叫做叫做平均数的标准差;平均数的标准差;n1、n2为两样本的为两样本的含量。含量。 121x2x2121xxSxxt21xxS)1()()1()(222221121121nnxxnnxxSxx 所得的统计量 t服从自由度 df =(n1-1)+(n2-1)的t分布。 根据两个样本的数据,计算得: - =511.2-478.4=32.8;1x2x)1()()1()(222221121121nnxxnnxxSxx45.65)15(89.47082.360085. 545. 64 .4782 .5112121xxSxxt 我
24、们需进一步估计我们需进一步估计出出 |t| 2.426的的两侧概率两侧概率,即估计,即估计P(|t|2.426)是多少?)是多少? 查查附表附表3,在,在 df =(n1-1)+ (n2-1) =(10-1)+(10-1)=18时时,两侧概率为,两侧概率为0.05的临界值:的临界值: = 2.101, P(|t|2.101)= P(t2.101)+ P(t 2.878)= P(t2.878) + P(t t t0.010.01P P 0.010.050.6950.05,所以不能拒绝原,所以不能拒绝原假设,即认为两样本来自的总体的方差相等。假设,即认为两样本来自的总体的方差相等。n对于均值的检验
25、,应对于均值的检验,应在假设方差相等假设下在假设方差相等假设下进行。其对应的进行。其对应的p p值为值为0.0260.050.026|t| t0.05所以认为显著水平所以认为显著水平=0.05下下推翻推翻H0 ,即这片杨树丰产林的平均树高与,即这片杨树丰产林的平均树高与10米米有显著性差异(有显著性差异( =0.05 )。)。 总结:显著性检验中应注意的问题 上面我们已详细阐明了显著性检验的意义及原理。上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题:进行显著性检验还应注意以下几个问题: 1 1、为了保证试验结果的可靠及正确,、为了保证试验结果的可靠及正确, 要有
26、严密合理要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。机抽取的。并且处理间要有可比性,即除比较的处理外并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确性。任何显著性检验的方法都不能保证结果的正确性。 2 2、选用的显著性检验方法应符合其应用条件、选用的显著性检验方法应符合其应用条件 。由于研究变量的类型、问题的性质、条件、试验设计方由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,
27、所用的显著性检验方法也不同法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,因而在选用检验方法时 , 应认真考虑其适用条件,应认真考虑其适用条件,不能滥用。不能滥用。 3、 要正确理解差异显著或极显著的统计意义要正确理解差异显著或极显著的统计意义 。显。显著性检验结论中的著性检验结论中的“差异显著差异显著”或或“差异极显著差异极显著”不应不应该误解为相差很大或非常大该误解为相差很大或非常大 ,也不能认为在专业上一,也不能认为在专业上一定就有重要或很重要的价值。定就有重要或很重要的价值。“显著显著”或或“极显著极显著”是是指表面上如此差别的不同样本来自同一总体的可能性小指表
28、面上如此差别的不同样本来自同一总体的可能性小于于0.05或或0.01,已达到了可以认为它们,已达到了可以认为它们有实质性差异的有实质性差异的显著水平显著水平。有些试验结果虽然差别大,但由于试验误差。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出大,也许还不能得出“差异显著差异显著”的结论,而有些试验的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推的结果间的差异虽小,但由于试验误差小,反而可能推断为断为“差异显著差异显著”。 显著水平的高低只表示下结论的可靠程度的高低显著水平的高低只表示下结论的可靠程度的高低 , 即在即在 0.01 水平下否定无效假设的可靠程度为水平
29、下否定无效假设的可靠程度为99 , 而在而在 0.05水平下否定无效假设的可靠程度为水平下否定无效假设的可靠程度为95%。 “差异不显著差异不显著”是指表面上的这种差异在同一总体是指表面上的这种差异在同一总体中出现的中出现的可能性大于统计上公认的概率水平可能性大于统计上公认的概率水平0.05,不能不能理解为试验结果间没有差异理解为试验结果间没有差异。下。下“差异不显著差异不显著”的结论的结论时,客观上存在两种可能:时,客观上存在两种可能: 一是本质上有差异一是本质上有差异,但被,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样
30、本容量,则可能表现出差异显著性;试验误差或增大样本容量,则可能表现出差异显著性;二是可能确无本质上差异二是可能确无本质上差异。显著性检验只是用来确定无。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。效假设能否被推翻,而不能证明无效假设是正确的。SPSS应用-单样本 T 检验n 操作步骤按照顺序:分析(Analyze) 比较均值(Compare Means ) 单样本 T 检验(One-Sample T Test),进入单一样本T检验 对话框,将左侧“身高”变量选入到“检验变量(Text Variables)”框中。右下角“检验值Test Value”框用于输入已知的总体
31、均值,默认值为0,在本例中为“165”。如下图所示 n结果解释结果解释:n此表给出了单一样本均值检验的描述性统计量,包括均值、此表给出了单一样本均值检验的描述性统计量,包括均值、标准差和均值标准误差。身高的均值为标准差和均值标准误差。身高的均值为164.93,接近总体均,接近总体均值值165,但还不能就此下结论,但还不能就此下结论。n结果解释结果解释n此表是单一样本均值检验的结果列表,给出了此表是单一样本均值检验的结果列表,给出了t统计量、自由统计量、自由度、双尾概率、显著水平及置信区间。双尾概率度、双尾概率、显著水平及置信区间。双尾概率P=0.9720.05,故不能拒绝原假设,认为故不能拒绝原假设,认为15个学生的平均身高与整个年级的个学生的平均身高与整个年级的平均身高平均身高165无显著性差异。无显著性差异。 谢谢聆听