1. 首页
  2. 文档大全

EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用

上传者:wang****1241 2022-06-12 18:26:36上传 DOCX文件 474.88KB
EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用_第1页 EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用_第2页

《EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用》由会员分享,可在线阅读,更多相关《EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用(13页珍藏版)》请在文档大全上搜索。

1、实验2指导:EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用实验目的1. 熟悉EXCEL和SPSS在数据分析中的操作;2. 使用EXCEL和SPSS进行回归分析、正交试验设计和判别分析。实验内容1. 一元线性回归分析例:近年來国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模,数据见data.xls的Sheets1)选择数据区域B2:C11,从“插入”菜单中选择“散点图”。Excel将显示相应散点图。2)选择图上的点,右键菜单,选择添加趋势线,如下图所示:设置截距=

2、0显示公式g)0显乗R平方值»z结果不仅显示散点图的趋势线,还会显示相应公式,即一元线性回归的回归函数,同时显示R平方值,R即相关系数,其绝对值越接近1,表示两组数据的线性相关程度越高。一元线性回归函数描述了两组数据间存在的线性关系,在上述例子中只要知道其它高校的人数即可根据该公式预测大概的季度销售额。而R的大小能够用于度量这种预测的准确度。另外,使用EXCEL自带的函数也能实现一元线性回归:截距函数INTERCEPT功能:利用己知的x值与y值计算回归直线在y轴的截距。语法结构:INTERCEPT(known_ySknown_x's)斜率函数SLOPE功能:返回根据known

3、_yt和known_x,s中的数据点拟合的线性回归直线的斜率。语法结构:SLOPE(known_ySknovm_x's)相关系数函数RSQ功能:返回根据known_yt和known_xt中数据点计算得出的相关系数的平方。语法结构:RSQ(known_y's,known_x's)试比较图表法和函数法呑算得出的二元线性回归方程是否一致。2. 多元线性回归分析例:一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(xl)和使用面积(x2)建立一个模型,一边对销售价格作出合理的预测。为此收集20栋住宅的房地产评估数据(data.xls的Sheet2)o由于本问题

4、有两个自变量,因此需要使用多元线性回归,需要借助于Excel的数据分析功能。1) 点击“数据分析”,跳出回归分析对话框;2) 填充应变量y和自变量xl,x2对应的区域和输出区域,如下图:区)回归3)点击确定后将出现多元线性回归的结果,对于结果(如下图a,b,c)的一些重要项解释如下:回归统卜MultipleR0.860941385RSquare0.741220068AdjustedRSquare0.71077537标准误差1331.729603观测值20图a方差分析dfSSMSFSignificanceF回归分析286357011.4843178505.7424.346441.02308E-0

5、5残差1730149563.521773503.737总计19116506575图bCoefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-285.0090434965.4493559-0.2952086940.77141-2321.9291151751.911-2321.9291751.911XVariabl1.5598002740.7829795591.9921340920.062668-0.0921421833.2117427-0.0921423.2117427XVariabl0.314487660.0905

6、036043.4748634020.0028980.1235417490.50543360.12354170.5054336图c图b中的SignificanceF及线性回归的pvalue,该值小于0.05表示此线性回归结果显著,及回归方程可信,房地产的销售价格与地产估价和使用面积是有关系的。图c中的Coefficients为回归方程的系数,因此,回归结果为y=285.0094+1.5598x1+03145x2,在使用面积不变的情况下,地产估价每增加1万元,房产销售的平均价格就会提高1.5598万元;在房地产估价不变的条件下,使用面积每增加1平方米,房产销售的平均价格就会提高0.3145元;图a

7、中AdjustedRSquare为调整复测定系数,本例中约为0.71,它表示两个变量xl,x2对导致结果y的贡献,也就是说还有导致结果y的原因中有29%是由除了xl,x2以外的因素造成的。习题:在黄罠提取工艺的研究中,选择了前煮时间、煎煮次数和加水量进行考察,实验数据见data.xls的Sheet3,试对实验数据进行多元线性回归,对结果进行讨论。3. logistic回归分析质量性状(qualitativecharacter)是指能观察到而不能直接测量的,只能用文字來描述其特征的性状,如食品颜色、风味等等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理。例

8、如:是否抽烟,是否患病。釆用线性回归分析显然不太合适,而logistic回归能较好地解决质量性状分析的问题。例:我们有一组数据,45个观测值,四个变量,包括:age(年龄,数值型);vision(视力状况,分类型,1表示好,0表示有问题);drive(驾车教育,分类型,1表示参加过驾车教育,0表示没有)和一个分类型输出变量accident(去年是否出过事故,1表示出过事故,0表示没有)。我们的目的就是要考察前三个变量与发生事故的关系。数据见data.xls的Sheet4.3.1计算优势比优势(odds)是指某影响因素控制在某种水平时,事件发生率与事件不发生率的比值,即P/(1-P)o某影响因素

9、的两个不同水平的优势的比值称为优势比,如某影响因素的一个水平为cl,另一个水平为co,则这两个水平的优势比为:结果吸烟不吸烟合计食管癌患者309(a)126(b)435非食管癌患者208(c)243(d)451合计517(a+c)369(b+d)886OR=例如:吸烟与食管癌关系的病例对照调查结果。吸烟的优势二型竺“49208/517非吸烟的优势=126/369243/369=0.52149OR=-=2.870.52 OR表示影响因素对事件发生的影响方向和影响能力大小。 0/?>1表示该因素取值越大,事件发生的概率越大,乂称危险因素。 0/?<1表示该因素取值越大,事件发生的概率越

10、小,乂称保护因素。 ORJ表示该因素与事件的发生无关。试计算视力和驾车教育对发生事故的优势比。3.2SPSS的安装1)启动虚拟机,并拷贝安装文件至虚拟机中;2)兰瞬省方式安装SPSS,最后在注册环节点取消即可;3)运行安装文件夹下spss_19_patch_V2目录中的SPSS19crack20100825.exe即可获得破解过的SPSSo3.2 SPSS数据的导入在spss中导入Excel文件中数据方法如下:点击SPSS中的文件一打开一数据,文件类型选*.xls,*xlsx,选择实验扌旨导文件夹中的data.xls,确定,然后工作表选Sheet4即可。3.3 SPSS用于logistic回归

11、1)数据导入以后,菜单栏上依次点击:分析一回归一二元logistic回归,打开相应对话框对话框。味事按分析.saw数据集1一IB1SPSSStatistics数据编输器文件(编辑旦视图凹数据(D)转换0)分析回直销勉图形实用程序®)W(W)帮助空為H3发生爭故112111770报吿描述统计表E比较均垃遁一股线性锲型厂叉线性魁»混合模型辺'相关©回归迟)对数线性模型(2)神经网络分类(£)降维度虽(S)非臭数检验刨预測生存函数多垂响应因缺矢値分W-多重归因复杂抽样质量控制SRoc曲线因也IUS自动线性建模®丽线性©0曲线估计跑咅


文档来源:https://www.renrendoc.com/paper/212619792.html

文档标签:

下载地址