第1章一元线性回归模型(双变量回归分析:一些基本概念)



《第1章一元线性回归模型(双变量回归分析:一些基本概念)》由会员分享,可在线阅读,更多相关《第1章一元线性回归模型(双变量回归分析:一些基本概念)(25页珍藏版)》请在文档大全上搜索。
1、第第1 1章章 一元线性回归模型一元线性回归模型前导:双变量回归分析的前导:双变量回归分析的一些基本概念一些基本概念 回归分析是要根据解释变量的已知或给定值,回归分析是要根据解释变量的已知或给定值,去估计或预测因变量的总体均值去估计或预测因变量的总体均值 假如我们要研究每周家庭消费支出假如我们要研究每周家庭消费支出Y与每周与每周可支配的家庭收入可支配的家庭收入X之间的关系之间的关系 假设这个国家的家体的总体由假设这个国家的家体的总体由60户家庭组成。户家庭组成。可以按收入的高低把这可以按收入的高低把这60户家庭分组,每一组的户家庭分组,每一组的组内收入相差不大。假定我们得到的观察值如表组内收入
2、相差不大。假定我们得到的观察值如表2.1所示所示v一个例子一个例子 表表2.1 X:每周家庭收入(:每周家庭收入($) 80100120140160180200220240260每每周周家家庭庭消消费费支支出出55657980102110120135137150607084931071151361371451526574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185115162191共计共计325464457076787506851043966121
3、1yx表2.1的含义:它给出了以X的给定值为条件的Y值的条件分布(conditional distribution) 因为表2.1代表一个总体,我们可以从表中计算出给定X的Y的概率,这在统计上叫做什么?比如: 51)80|55(XYP71)260|150(XYP对对Y的每一个条件概率分布,我们所计算出它的均的每一个条件概率分布,我们所计算出它的均值(值(mean或或average value),称为条件均值),称为条件均值(conditional mean)或条件期望()或条件期望(conditional expectation),记做:),记做: 比如,给定比如,给定X80(|)iE Y X
4、X6551755170516551605155)80|(XYE可以由表可以由表2.1绘制如绘制如右图的散点右图的散点图图散点图表明对应于各个X值的Y的条件分布,它表明随着收入的增加,消费支出平均地说也在增加。Y的条件均值随X增加而增加。图中的粗圆点(大的黑点)表示Y的各个条件均值Y的条件均值落在一条正斜率的直线上,这条线叫总体回归线(population regression line or curve),它代表Y对X的回归从几何意义上讲,总体回归曲线就是,当解释变从几何意义上讲,总体回归曲线就是,当解释变量取给定值时,因变量的条件均值或条件期望的轨迹量取给定值时,因变量的条件均值或条件期望的
5、轨迹 图图2.1可以画成图可以画成图2.2的形式的形式可见,对应于每一个可见,对应于每一个Xi都有一个都有一个Y值的总体和值的总体和一个相应的条件均值。而回归直线(曲线)正好一个相应的条件均值。而回归直线(曲线)正好穿过这些条件均值穿过这些条件均值 v总体回归函数(PRF,population regression function) 由图2.1和图2.2可见,每一个条件均值都是 的一个函数,即: (2.2.1) 这个方程就叫做(双变量的)总体回归函数(PRF)或简称总体回归(population regression, PR),它表明Y的均值或平均响应(average response)是如
6、何随X而不同 的具体函数形式如何确定是一个经验问题,已知的经济理论可以给我们一些指导。假如, 是的线性函数: (2.2.2) 和 为回归系数(regression coefficients),(2.2.2)称为线性总体回归函数,或简称线性总体回归。iX)()|(iiXfXYE)(iXf)|(iXYEiXiiXXYE21)|(12在我们的课程中,回归,回归方程和回归模型将在我们的课程中,回归,回归方程和回归模型将不加以区分,作为同义词使用不加以区分,作为同义词使用 v “线性线性”一词的含义一词的含义 (2.2.2)式被称为)式被称为“线性线性”总体回归,其中的总体回归,其中的“线性线性”的含义
7、是什么?的含义是什么?它可以作两种解释:它可以作两种解释:(1)对变量为线性)对变量为线性即:即:Y的条件期望值是的条件期望值是 的线性函数,从的线性函数,从几何几何意意义上看,这样的义上看,这样的回归曲线是一条直线。回归曲线是一条直线。诸如:诸如:这样的回归函数,就不是线性的。这样的回归函数,就不是线性的。iX221)|(iiXXYE (2)对参数为线性)对参数为线性 即即Y的条件期望的条件期望 是参数是参数 的一个线性函数;的一个线性函数;它既可以是也可以不是变量它既可以是也可以不是变量X的线性函数的线性函数这样以来,这样以来, 就是一个线性回归模型,就是一个线性回归模型,而而则不是线性的
8、。则不是线性的。 在在今后的课程中今后的课程中,我们讲的,我们讲的“线性线性”指的是指的是对参数为对参数为线性的线性的情况,对解释变量情况,对解释变量 则可以是也可以不是线性的。则可以是也可以不是线性的。如:如:是一个是一个LRM(linear regression model))|(iXYEi221)|(iiXXYEiiXXYE21)|(iX221)|(iiXXYEv PRF的随机设定 我们现在再回到表2.1和图2.1,可见,随着家庭收入,家庭消费支出平均地看也会;但是对具体的某一个家庭的消费支出却不一定随收水平而 给定收入水平 的个别家庭的消费支出,聚集在收入为 的所有家庭的平均消费支出的