第四章相关分析和

《第四章相关分析和》由会员分享,可在线阅读,更多相关《第四章相关分析和(126页珍藏版)》请在文档大全上搜索。
1、第四章第四章 相关分析和回归分析相关分析和回归分析相关分析和回归分析相关分析和回归分析第一节第一节 地理要素间的地理要素间的相关分析相关分析第二节第二节 地理要素间的地理要素间的回归分析回归分析一一 相关关系与函数关系相关关系与函数关系二二 地理要素的相关类型地理要素的相关类型三三 相关程度的程度方法及显相关程度的程度方法及显著性检验著性检验 第一节第一节 地理要素间的地理要素间的相关分析相关分析一一 相关关系与函数关系相关关系与函数关系 1.确定性的函数关系确定性的函数关系 。 2.不确定性的统计关系不确定性的统计关系相关关系相关关系3. 相关关系与函数关系的共同点,区别与联系相关关系与函数
2、关系的共同点,区别与联系(1) 共同点:都是反映现象变量之间存在的相互依存关系。共同点:都是反映现象变量之间存在的相互依存关系。 (2) 区别:相关关系是一种不严格的依存关系,函数关系区别:相关关系是一种不严格的依存关系,函数关系是严格确定的依存关系。是严格确定的依存关系。 (3) 联系:由于观察值和测量误差的存在,函数关系在现联系:由于观察值和测量误差的存在,函数关系在现实生活中往往通过相关关系表现出来;而相关关系又往往要实生活中往往通过相关关系表现出来;而相关关系又往往要使用函数关系的形式来模拟描述使用函数关系的形式来模拟描述。()Yf X()Yf Xn为了研究父亲与成年儿为了研究父亲与成
3、年儿子身高之间的关系,卡子身高之间的关系,卡尔尔.皮尔逊测量了皮尔逊测量了1078对对父子的身高。把父子的身高。把1078对对数字表示在坐标上,如数字表示在坐标上,如图。图。n它的形状象一块橄榄状它的形状象一块橄榄状的云,中间的点密集,的云,中间的点密集,边沿的点稀少,其主要边沿的点稀少,其主要部分是一个椭圆。部分是一个椭圆。正相关 负相关 完全正相关 完全负相关 零相关 二二 地理要素间的相关类型地理要素间的相关类型曲线相关(非线性相关)曲线相关(非线性相关)按变量按变量 数量数量两个变量两个变量两个以上两个以上 变量变量直线相关(线性相关)直线相关(线性相关)复相关复相关偏相关偏相关按质量
4、按质量等级相关(顺序相关)等级相关(顺序相关)品质相关品质相关 三三 相关程度的度量及显著性检验相关程度的度量及显著性检验由于地理相关类型各不相同,因此测度的方法也不同。由于地理相关类型各不相同,因此测度的方法也不同。(一)线性相关程度的测度(一)线性相关程度的测度所谓所谓相关程度相关程度,就是研究它们之间的相互关系是否密切。,就是研究它们之间的相互关系是否密切。所谓所谓相关方向相关方向,又可以分两种,即正相关和负相关。,又可以分两种,即正相关和负相关。n正相关正相关变量同方向变化,同增同减变量同方向变化,同增同减n负相关负相关变量反方向变化,一增一减变量反方向变化,一增一减n 不相关不相关用
5、来测度直线相关程度和方向的指标就是相关系数。用来测度直线相关程度和方向的指标就是相关系数。 当两个变量之间为直线相关时当两个变量之间为直线相关时,可以利用皮尔逊相关系数可以利用皮尔逊相关系数表示变量之间的相关关系及程度表示变量之间的相关关系及程度 设设 表示变量表示变量 , 的取值的取值, 为两为两个变量的算术平均数个变量的算术平均数, , 为这两个变量的标准差为这两个变量的标准差, 为自为自变量数列与因变量数列的协方差,变量数列与因变量数列的协方差, 为相关系数,则直线相关为相关系数,则直线相关系数定义为:系数定义为:),2 , 1)(,(niyxiiXYyx,x2yxyxyxr2y1. 简
6、单相关系数公式及检验简单相关系数公式及检验 r(1) 简单相关系数公式简单相关系数公式22)(1)(xxnnxxx)(12yyxxnxy22)(1)(yynnyyy22)()()(yyxxyyxxr222222)2()(xxxxxxxxxxnyyyy222)(nyxxyyyxx)( )(2222)(22nxnxnxxxnxxxnxx22)(nxxxx222)()(22)()()(yyxxyyxxrnyynxxyxnxyr22221(2)相关系数的性质)相关系数的性质相关系数的分布范围,介于相关系数的分布范围,介于-1-1和和+1+1之间之间当相关系数为正值时,表示两个要素(或变数)之间呈正相当
7、相关系数为正值时,表示两个要素(或变数)之间呈正相关,相关系数为负值时,表示两个要素(或变数)之间为负相关;关,相关系数为负值时,表示两个要素(或变数)之间为负相关;相关系数的绝对值越大。表示两个要素间相关程度越密切。相关系数的绝对值越大。表示两个要素间相关程度越密切。当r=+1时,为完全正相关。R=-1时,为完全负相关;r=0则完全无直线相关,可能存在其他形式的相关关系。 (3)相关程度的判断)相关程度的判断当当 时,时,X与与Y高度相关高度相关当当 时,时,X与与Y显著相关显著相关当当 时,时,X与与Y低度相关低度相关当当 时,时,X与与Y微相关或不相关微相关或不相关0 . 18 . 0r
8、8 . 05 . 0r5 . 03 . 0r3 . 00 . 0r 例 某企业生产某种产品的月产量和生产费用的统计资料如表,试判断月产量与生产费用之间存在怎样相关关系,相关程度为多少。 序号 月产量 生产费用 序号 月产量 生产费用 1 2 3 4 1.2 2.0 3.1 3.8 62 86 80 110 5 6 7 8 5.0 6.1 7.2 8.0 115 132 135 160 表 月产量和生产费用的统计资料(4)简单相关系数的应用)简单相关系数的应用序号 iX iY 2iX 2iY iiYX 1 2 3 4 5 6 7 8 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0
9、 62 86 80 110 115 132 135 160 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 3844 7396 6400 12100 13225 17424 18225 25600 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0 合计 36.4 880 207.54 104214 4544.6 相关系数数据计算表 nyynxxyxnxyr22221)8880104214)(84 .3654.207()880)(4 .36(816 .45442297. 0741492.416 .540表明X
10、与Y之间存在线性相关关系,且是高度相关。 和和 都是相互对称的随机变量都是相互对称的随机变量 线性线性相关系数只反映变量间的线性相关程度,不相关系数只反映变量间的线性相关程度,不 能说明非线性相关关系能说明非线性相关关系 样本相关系数是总体相关系数的样本估计值,由样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量,其统于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验计显著性有待检验 相关系数只能反映线性相关程度,不能确定因果相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线关系,不能说明相关关系具体接近哪条直线 使用简单相
11、关系数时的注意事项使用简单相关系数时的注意事项XY 相关系数是根据要素之间的样本值计算出来相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少或取样方式的不同而不的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。通过检验,才能知道它的可信度。 (5)相关系数的显著性检验)相关系数的显著性检验 一般情况下,相关系数的检验,是在给定的一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来置信水平下,通过查相关系数检验的临界值表来完成的。完成的。检验相关系数检验