1. 首页
  2. 文档大全

抽样理论和参数估计.

上传者:9****8 2022-05-24 16:52:20上传 PPT文件 194.01KB
抽样理论和参数估计._第1页 抽样理论和参数估计._第2页 抽样理论和参数估计._第3页

《抽样理论和参数估计.》由会员分享,可在线阅读,更多相关《抽样理论和参数估计.(49页珍藏版)》请在文档大全上搜索。

1、任课老师:禤宇明任课老师:禤宇明p基本概念基本概念n总体、个体、总体容量、样本、样本容量、抽样、参总体、个体、总体容量、样本、样本容量、抽样、参数、统计量数、统计量p抽样方法抽样方法n随机、等距、分层随机、等距、分层p抽样分布抽样分布n样本平均数:样本平均数:Z分布、分布、t分布分布n样本方差:卡方分布、样本方差:卡方分布、F分布分布p参数估计参数估计n点估计:充分性、无偏性、有效性、一致性点估计:充分性、无偏性、有效性、一致性n区间估计:显著性水平、置信度、置信区间区间估计:显著性水平、置信度、置信区间p总体总体(population):要研究的事物或现象的总体:要研究的事物或现象的总体p个

2、体个体(unit):组成总体的每个元素:组成总体的每个元素(成员成员)p总体容量总体容量(population size):一个总体中所含个体的数量:一个总体中所含个体的数量p样本样本(sample):从总体中抽取的部分个体:从总体中抽取的部分个体p样本容量样本容量(sample size):样本中所含个体的数量:样本中所含个体的数量p抽样抽样(sampling):为推断总体的某些重要特征,需要从总:为推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体的过程体中按一定抽样技术抽取若干个体的过程p参数参数(parameter):反映总体数据特征的量数:反映总体数据特征的量数p统计量统

3、计量(statistic):反映样本数据特征的量数:反映样本数据特征的量数n统计量是样本的函数,只依赖于样本;样本均值、样本方差等都统计量是样本的函数,只依赖于样本;样本均值、样本方差等都是统计量是统计量总体总体样本样本X参数统计量统计量参数估计参数估计差异检验差异检验p完全随机地选取样本,要求有总体中每一个个体完全随机地选取样本,要求有总体中每一个个体的详尽名单,给总体的详尽名单,给总体N个元素编号个元素编号n抽签抽签n随机数字表随机数字表p又称系统抽样又称系统抽样 (systematic sampling) n给总体给总体N个元素编号个元素编号n抽样间距抽样间距 kN/nn随机确定起点随机

4、确定起点 a (1a k)na, a+k, a+2k, , a+(n-1)kp受总体数据的受总体数据的周期性周期性的影响的影响p例:从例:从N800的总体中抽取的总体中抽取50个样本个样本p先将总体分成不同的先将总体分成不同的“层层”,然后在每一,然后在每一“层层”内进行简单随机抽样内进行简单随机抽样n分层原则:层内变异要小,层间的变异要大分层原则:层内变异要小,层间的变异要大n可防止简单随机抽样造成的样本构成与总体构成不成可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。比例的现象。3.1 样本平均数的分布样本平均数的分布 sampling distribution of the m

5、eanp采用随机抽样的方法,从总体中抽取大小为采用随机抽样的方法,从总体中抽取大小为n的的样本,计算出它的平均数样本,计算出它的平均数X1,然后将这些个体放,然后将这些个体放回总体去,再次取回总体去,再次取n个个体,又可以计算出个个体,又可以计算出X2, 再将再将n个个体放回去,再抽取个个体放回去,再抽取n个个体,可以计算个个体,可以计算出无限个出无限个X,这些样本平均数,这些样本平均数X所有可能值的概率所有可能值的概率分布叫平均数分布叫平均数X的抽样分布的抽样分布n总体方差已知总体方差已知n总体方差未知总体方差未知1 ,0,22212NnXnXZnNXxxxNXn即,则样本平均数随机抽取样本

6、如果总体 nnnnxDxDxDnxDnnxDXDnnnxExExEnxxxEnxnEXEnniiniinnnii222222221212121211).(1)(.)()(1)(1)().(1)(.)()(1.11证:p中心极限定理中心极限定理Central Limit Theoremn设从均值为设从均值为 ,方差为方差为 2(有限)的任意一个总体中抽(有限)的任意一个总体中抽取大小为的样本,当充分大时,样本均值取大小为的样本,当充分大时,样本均值X的抽样的抽样分布近似服从均值为分布近似服从均值为 ,方差为方差为 2/的正态分布。的正态分布。p注:什么叫充分大呢?注:什么叫充分大呢?n总体偏离正

7、态越远,则要求就越大。在实际应用中总体偏离正态越远,则要求就越大。在实际应用中常要求常要求 30 或者或者 50 p样本平均数的标准差称为标准误样本平均数的标准差称为标准误nnSEnNXNXX222,,6maxmax221056. 6)()(,359. 4882. 360923.76,923.76131000,882. 360),882. 3 ,60()1314,60(131460maxmaxXXXXZZPXXPZXXZNNXn,解:0094. 0)35. 2()85. 05452()52()2(),85. 0 ,54() 1 (,85. 072. 0,72. 0506222ZPZPXPNXX

8、X解:p当总体方差当总体方差 2未知时,用未知时,用S2作为作为 2的估计值的估计值11)(11,122221ntnSXttntXXnStnSXtNXxxxniin分布,即的服从自由度为且其中,统计量为定义,为来自正态总体设样本 ntttnnYXtYXnYNX1 , 02分布,记做的服从自由度为则随机变量相互独立,与,且,设p可以自由取值的变量的个数可以自由取值的变量的个数n任意说出三个整数任意说出三个整数 n任意说出三个和为任意说出三个和为100的整数的整数p对称:左侧为负,右侧为正,均值为对称:左侧为负,右侧为正,均值为0p- t 30时时, t分布为接近正态分布,方差分布为接近正态分布,

9、方差1,nn45时时, t分布与正态分布没有多大差异分布与正态分布没有多大差异n在小样本在小样本n 2)p连续型分布连续型分布p例例4-4 P108df = 5,求,求 = 0.05和和 = 0.01时的单侧临界值时的单侧临界值p解:解: nPn2222临界值变量在不同自由度下的列出了09.15)5(07.11)5(201. 0205. 0 2121212212,nnFFFnnnYnXFYXnYnX分布,记做的,第二自由度为服从第一自由度为则称随机变量相互独立,与,且设1, 11, 1111111111111,212221222121222221211222222212111222212221

10、212222222221221211212222221212112121nnFSSFnnFSSnSnnSnnnnnFnSnnSnSNYyyySNXxxxnn时,当,方差为来自总体样本,方差为来自总体设样本pF(n1,n2)分布形态是正偏态分布,形式随分布形态是正偏态分布,形式随n1,n2不同而不同,随不同而不同,随n1,n2的增加而渐趋正态分布的增加而渐趋正态分布pF为两个方差比率,所以为正值为两个方差比率,所以为正值pn1=1,n2任意时,任意时,F值与自由度为值与自由度为n2的的t值的平方值的平方相等,即相等,即F(1,n2) = t2(n2)pF (n1,n2)=1/F1- (n2,n1

11、)pF分布是统计学家费歇尔分布是统计学家费歇尔(R. A. Fisher)于于1924年首年首先发现的先发现的n假设检验假设检验n区间估计区间估计n方差分析方差分析n回归分析回归分析p根据最大允许误差确定样本容量根据最大允许误差确定样本容量2222222212dppzndStndznzndXdznX或同理有,最大允许误差由样本平均数分布p样本容量样本容量n,总体方差,总体方差 2,允许误差,允许误差d,可靠性系,可靠性系数数Z /2的关系的关系n总体方差越大,需要的样本容量越大;总体方差越大,需要的样本容量越大;n允许误差越大,需要的样本容量越小;允许误差越大,需要的样本容量越小;n可靠性系数

12、越大,需要的样本容量越大;可靠性系数越大,需要的样本容量越大;p例:要使例:要使95%置信区间的允许误差为置信区间的允许误差为5,应选取多,应选取多大的样本容量?假定总体的标准差为大的样本容量?假定总体的标准差为25。p例:例: 一家广告公司想估计某类商店去年所花的平一家广告公司想估计某类商店去年所花的平均广告费有多少。检验表明,总体方差约为均广告费有多少。检验表明,总体方差约为1800000。如置信度取。如置信度取95,并要使估计值处在总,并要使估计值处在总体平均值附近体平均值附近500元的范围内,这家广告公司应取元的范围内,这家广告公司应取多大的样本?多大的样本?p例:一家市场调研公司想估

13、计某地区有彩色电视例:一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对机的家庭所占的比例。该公司希望对p的估计误的估计误差不超过差不超过0.05,要求的可靠程度为,要求的可靠程度为95%,应取多,应取多大容量的样本大容量的样本?p例:例: 一项调查中,总体比率的计划值为一项调查中,总体比率的计划值为0.35,则,则当允许的最大绝对误差为当允许的最大绝对误差为0.05时,在求其时,在求其95%置置信区间时应采用多大的样本容量?信区间时应采用多大的样本容量?设总体有待估参数设总体有待估参数 ,自总体中抽取样本,自总体中抽取样本x1,x2,xnp点估计点估计 point est

14、imaten用样本的某一统计量估计用样本的某一统计量估计 如用样本均值估计总体均值如用样本均值估计总体均值p区间估计区间估计 interval estimaten求出一定概率下求出一定概率下 的取值范围的取值范围统计量作为估计量统计量作为估计量 estimatorp充分性充分性 sufficiencyn用到样本的所有数据用到样本的所有数据p无偏性无偏性 unbiasednessn估计值的平均值与真值一致估计值的平均值与真值一致p有效性有效性 efficiencyn当总体参数的无偏估计量有不止一个统计量时,无偏当总体参数的无偏估计量有不止一个统计量时,无偏估计变异性最小者有效性高,变异大者有效性

15、低估计变异性最小者有效性高,变异大者有效性低p一致性一致性 consistencyn当样本容量无限增大时,估计值越来越接近所估计的当样本容量无限增大时,估计值越来越接近所估计的总体参数总体参数p哪个是更好的估计量?哪个是更好的估计量?n算术平均数算术平均数 vs. 中数中数 nnnxExExEnxxxEnxnEXESXxxxNXnnniin).(1)(.)()(1.11,2121122212证:的无偏估计量是总体方差而样本方差的无偏估计量,是总体均值则样本平均数,随机抽取样本如果总体p区间估计的原理区间估计的原理n样本统计量的分布规律样本统计量的分布规律p显著性水平显著性水平 signific

16、ance leveln也叫置信系数,指估计总体参数可能落入某区间时犯也叫置信系数,指估计总体参数可能落入某区间时犯错误的概率错误的概率n 通常有三个标准:通常有三个标准: :0.05, 0.01, 0.001 1- :0.95, 0.99, 0.999p置信水平、置信度置信水平、置信度 confidence leveln1- p置信区间置信区间 confidence intervaln指在某一置信水平时,总体参数所在的区域距离或区指在某一置信水平时,总体参数所在的区域距离或区域长度域长度),(1,1,1,1,22222222222nZXnZXnZXnZXPZnXZPZZZPnXZnNXNX的置

17、信区间为置信水平为的已知时,总体均值方差因此,总体正态分布且对给定显著性水平已知77.8332 .7299.38.8226 .7395.1018. 13607. 724. 21007. 799.95.7978361007. 7121212121置信区间置信区间的样本估计总体参数用解:求标准误置信区间。和的求总体参数,两个样本,和随机抽取。从这个总体中布,例:已知总体为正态分nnnXXnnXXnZXnZX22,54.9146.6899.77.8823.7195.80588709483659995887094836551002置信区间置信区间解:的置信区间。和的求全体考生成绩均值,名考生的成绩为,

18、从中抽得差试全体考生成绩总体方例:已知某校的一次考XnZXnZX22,nStXnStXntnSXtxxxn2221,1,为置信区间来自正态总体,则设样本83.81,17.62,306. 2)8(, 9,79.12,72856570687450629183922205. 0nStXnStXtnSX解:成绩均值做区间估计。试对全年级该次测验的,个考生的成绩为测试后从中抽取的,学生进行英语水平测试例:某校对高中一年级nSZXnSZXtZnStXnStXn222222,30置信区间为,即代替上式中的也可以用近似正态分布,因为此时样本均值服从时,置信区间仍为当2121221222212122212221

19、222212121222221,111111111 , 0,nnnnnnnSnSnSnSnPSnPSnXZNXZNX的置信区间为的置信水平为因此,对给定显著性水平而那么已知总体)差的范围(取试确定语文成绩的标准。,份,其成绩为考试中,随机抽取例:某校高中语文毕业05. 08277859088837992917886897268751554.11,36. 511.133,69.281,163. 5,12.26,975. 021 ,025. 02,05. 0,52.53212122122214975. 0214025. 02nnSnSnS解:2221222212222122212222122212222222121222222212121212222212122222212121121,111111, 1,11SSFSSFSSFSSFFSSFPFSSFPnnFSSFSNYyyySNXxxxnn为置信水平上的置信区间在因此,对给定那么,方差为来自总体样本,方差为来自总体设样本


文档来源:https://www.renrendoc.com/paper/212391404.html

文档标签:

下载地址