1. 首页
  2. 文档大全

第6讲一元线性回归分析

上传者:2****5 2022-06-29 07:20:37上传 PPT文件 1.62MB
第6讲一元线性回归分析_第1页 第6讲一元线性回归分析_第2页 第6讲一元线性回归分析_第3页

《第6讲一元线性回归分析》由会员分享,可在线阅读,更多相关《第6讲一元线性回归分析(60页珍藏版)》请在文档大全上搜索。

1、第第 6 讲一元线性回归讲一元线性回归学习目标学习目标l相关关系的分析相关关系的分析l参数的最小二乘估计参数的最小二乘估计l回归直线的拟合优度回归直线的拟合优度l回归方程的显著性检验回归方程的显著性检验l利用回归方程进行预测利用回归方程进行预测l用用 Excel 和和SPSS进行回归进行回归回归分析研究什么?回归分析研究什么?l研究某些实际问题时往往涉及到多个变量。在这些变量研究某些实际问题时往往涉及到多个变量。在这些变量中,有一个变量是研究中特别关注的,称为因变量,而中,有一个变量是研究中特别关注的,称为因变量,而其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因

2、素,称为自变量l假定因变量与自变量之间有某种关系,并把这种关系用假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,那么,就可以利用这一模型适当的数学模型表达出来,那么,就可以利用这一模型根据给定的自变量来预测因变量,这就是回归要解决的根据给定的自变量来预测因变量,这就是回归要解决的问题问题l在回归分析中,只涉及一个自变量时称为一元回归,涉在回归分析中,只涉及一个自变量时称为一元回归,涉及多个自变量时则称为多元回归。如果因变量与自变量及多个自变量时则称为多元回归。如果因变量与自变量之 间 是 线 性 关 系 , 则 称 为之 间 是 线 性 关 系 , 则 称 为 线 性

3、回 归线 性 回 归 ( l i n e a r regression);如果因变量与自变量之间是非线性关系;如果因变量与自变量之间是非线性关系则称为则称为非线性回归非线性回归(nonlinear regression)怎样分析变量间的关系?怎样分析变量间的关系?l建立回归模型时,首先需要弄清楚变量之间的建立回归模型时,首先需要弄清楚变量之间的关系。分析变量之间的关系需要解决下面的问关系。分析变量之间的关系需要解决下面的问题题1.变量之间是否存在关系?2.如果存在,它们之间是什么样的关系?3.变量之间的关系强度如何?4.样本所反映的变量之间的关系能否代表总体变量之间的关系? 6.1.1 变量间

4、是什么样的关系?变量间是什么样的关系?函数关系函数关系1. 是一一是一一对应的确定关系对应的确定关系2. 设设有两个变量有两个变量 x 和和 y ,变量,变量 y 随变量随变量 x 一起变化,并完全一起变化,并完全依赖于依赖于 x ,当变量,当变量 x 取某个取某个数值时,数值时, y 依确定的关系取依确定的关系取相应的值,则称相应的值,则称 y 是是 x 的函的函数,记为数,记为 y = f (x),其中,其中 x 称为自变量,称为自变量,y 称为因变量称为因变量3. 各各观测点落在一条线上观测点落在一条线上 相关关系相关关系(几个例子几个例子)l子女的身高与其父母身高的关系子女的身高与其父

5、母身高的关系u从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响l一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系u收入水平相同的人,他们受教育的程度也不可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职业、工作年限等诸多因素的影响l农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的关系u在一定条件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决

6、定的,还有施肥量、温度、管理水平等其他许多因素的影响相关关系相关关系(correlation)1. 一个变量的取值不能由另一个变量的取值不能由另一个变量唯一确定一个变量唯一确定2. 当变量当变量 x 取某个值时,变取某个值时,变量量 y 的取值对应着一个的取值对应着一个分分布布3. 各观测各观测点分布在直线周围点分布在直线周围 6.1.2 用散点图描述相关关系用散点图描述相关关系散点图散点图(scatter diagram)用散点图描述变量间的关系用散点图描述变量间的关系(例题分析例题分析)v【例例】为研究销售收入与广告费用支出之间的关系,为研究销售收入与广告费用支出之间的关系,某医药管理部门

7、随机抽取某医药管理部门随机抽取20家药品生产企业,得到家药品生产企业,得到它们的年销售收入和广告费用支出它们的年销售收入和广告费用支出(万元万元)的数据如下。的数据如下。绘制散点图描述销售收入与广告费用之间的关系绘制散点图描述销售收入与广告费用之间的关系 2008年年8月月散点图散点图(销售收入和广告费用的散点图销售收入和广告费用的散点图)6.1.3 用相关系数度量关系强度用相关系数度量关系强度相关系数相关系数(correlation coefficient)1. 度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

8、 若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r或Rl也称为Pearson相关系数 (Pearsons correlation coefficient)2. 样本相关系数的计算公式样本相关系数的计算公式 相关系数的性质相关系数的性质v性质性质1:r 的取值范围的取值范围是是 -1,1|r|=1,为完全相关lr =1,为完全正相关lr =-1,为完全负正相关r = 0,不存在线性线性相关关系-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱相关系数的性质相关系数的性质v性质性质2:r具有对称性。即具有对称性。即x与与y之间的相关系数和之

9、间的相关系数和y与与x之间的相关系数相等,即之间的相关系数相等,即rxy= ryxv性质性质3:r数值大小与数值大小与x和和y原点及尺度无关,即改变原点及尺度无关,即改变x和和y的数据原点及计量尺度,并不改变的数据原点及计量尺度,并不改变r数值大小数值大小v性质性质4:仅仅是:仅仅是x与与y之间线性关系的一个度量,它不之间线性关系的一个度量,它不能用于描述非线性关系。这意为着,能用于描述非线性关系。这意为着, r=0只表示两个只表示两个 v变量之间不存在线性相关关系,并不说明变量之间没变量之间不存在线性相关关系,并不说明变量之间没有任何关系有任何关系v性质性质5:r虽然是两个变量之间线性关系的

10、一个度量,虽然是两个变量之间线性关系的一个度量,却不一定意味着却不一定意味着x与与y一定有因果关系一定有因果关系相关系数的经验解释相关系数的经验解释1. |r| 0.8时,可视为两个变量之间高度相关时,可视为两个变量之间高度相关2. 0.5 |r|0.8时,可视为中度相关时,可视为中度相关3. 0.3 |r|0.5时,视为低度相关时,视为低度相关4.|r|0.3时,说明两个变量之间的相关程度极弱时,说明两个变量之间的相关程度极弱,可视为不相关,可视为不相关5. 上述解释必须建立在对相关系数的显著性进行上述解释必须建立在对相关系数的显著性进行检验的基础之上检验的基础之上相关系数的显著性检验相关系

11、数的显著性检验(检验的步骤检验的步骤)v1.检验两个变量之间是否存在线性相关关系检验两个变量之间是否存在线性相关关系2. 采用采用R.A.Fisher提出的提出的 t 检验检验3. 检验的步骤为检验的步骤为提出假设:H0: ;H1: 0计算检验的统计量用Excel中的【TDIST】函数得双尾计算P值,并于显著性水平比较,并作出决策 若P,拒绝H0相关系数的显著性检验相关系数的显著性检验(例题分析例题分析)v【例例】检验销售收入与广告费用之间的相关系数是检验销售收入与广告费用之间的相关系数是否显著否显著 ( 0.05)1. 提提出假设:出假设:H0: ;H1: 02. 计算计算检验的统计量检验的


文档来源:https://www.renrendoc.com/paper/212651564.html

文档标签:

下载地址