人民大学《统计学》题库及答案

《人民大学《统计学》题库及答案》由会员分享,可在线阅读,更多相关《人民大学《统计学》题库及答案(113页珍藏版)》请在文档大全上搜索。
1、1 中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码: 123201考题卷号: 1一、 (20 分) 随机抽取 20 块手机电池,测得其使用寿命数据如下(单位:小时):10089939981007101110021013999100899598399510009771015101099810051011996列出描述上述数据所适用的统计图形,并说明这些图形的用途。直方图:直观的展示一组数据(电池使用寿命)的分布情况。箱线图:直观反映原始数据(电池寿命)的数据分布的特征,如偏态,是否有离群点。二、 (20 分)方差分析中有哪些基本假定?这些假定中对哪
2、个假定的要求比较严格?1、方差分析有 3 个基本假定:( 1)正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;( 2)方差齐性:各个总体的方差必须相同;( 3)独立性:每个样本数据是来自因子各水平的独立样本12、对独立性要求比较严格,独立性得不到满足会对方差分析结果有较大影响,对正态性和方差齐性的要求相对比较宽松。三、 (20 分)某种食品每袋的标准重量是100 克,从该批食品中抽取一个随机样本,检验假设H0 :100,H1100。(1) 如果拒绝 H 0 ,你的结论是什么?, 如果不拒绝 H 0 ,你的结论是什么?(2) 能否得到一个样本能
3、够证明该食品的平均重量是100克?请说明理由。(3) 如果由该样本得到的检验的 P 0.03 ,你的结论是什么? 0.03 这个值是犯第类错误的概率, 是实际算出来的显著性水平,你怎样解释这个 P 值?( 1)拒绝 H 0 :该种食品每袋的平均重量不是100g不拒绝 H0 :提供的样本不能证明该种食品每袋的平均重量不是 100g( 2)不能,样本得出的结论只能是拒绝或不拒绝原假设,并不能直接确定原假设为真( 3)结论:若给定显著性水平为 0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是 100 克;但若给定显著性水平为 0.01,则不能拒绝原假设P 值: 如果该种食品每袋的平均重量是1
4、00g,样本结果会像实际观测那样极端或更极端的概率仅为0.03四、 (20 分)在建立多元线性回归模型时, 通常需要对自变量进行2筛选。(1)请谈谈你对变量筛选的必要性的看法。(2) 列出变量筛选的方法,请简要说明这些方法的特点。( 1)若将所有的自变量都引入回归模型,往往会导致所建立的模型不能进行有效的解释,也可能会导致多重共线性,增加自变量还会导致判定系数R2 增大,从而高估模型拟合优度。( 2)变量筛选有向前选择、向后剔除、逐步回归等方法。特点如下:向前选择:从没有自变量开始,不停向模型中增加自变量,直到增加不能导致 SSE 显著增加为止。向后剔除:从所有自变量开始,不停从模型中剔除自变
5、量,直到剔除不能导致 SSE 显著减小为止。逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复,直到增加变量不能导致 SSE 显著减少为止。五、 (20 分)如果一个时间序列包含趋势、季节成分、随机波动,适用的预测方法有哪些?对这些方法做检验说明。可以使用 Winter 指数平滑模型、引入季节哑变量的多元回归和分解法等进行预测。( 1) Winter 指数平滑模型包含三个平滑参数,即、 、 (取值均在01 ),以及平滑值 ?、趋势项更?3新 ?、季节项更新 ?、未来第k 期
6、的预测值 ?。?+kL 为季节周期的长度,对于季度数据,L=4 ,对于月份数据,L=12 ;I 为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是 t 期的季节调整因子, ? = (? + ?)? 是用于预测的模型。?+?-?+?使用 Winter模型进行预测, 要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4 年以上的数据) 。使用 Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4 年以上的数据)。( 2)引入季节哑变量的多元回归对于以季度记录的数据,引入3 个哑变量?234,其中2 =1(第 1 季度
7、 )或 0(其他季度 ),以此类推,则季、 ?、?节性多元回归模型表示为:?22 + ?33 + ?44?= ?0 + ?+1其中 b0 是常数项, b1 是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4 表示每一季度与参照的第 1 季度的平均差值。( 3)分解预测第 1 步,确定并分离季节成分。计算季节指数,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。第 2 步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。第 3 步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测
8、值。42 中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码: 123201考题卷号: 2一、 (20 分)在某小学随机抽取35 名小学生,调查他们每周购买零食的花费情况,得到的数据如下(单位:元):241726293862844398301726324010202743331542835264725172645163629375列出描述上述数据所适用的统计量,并说明这些统计量的用途。平均数:用于度量对象的一般水平。中位数(分位数):用中间(某个)位置上的值代表数据水平,也用于度量对象的一般情况, 且不受极值的影响具有稳定性。方差(标准差):用于描述
9、一组数据的差异水平,越大说明数据的分布越分散不稳定。偏态系数:用于描述数据分布的不对称性,越接近 0 越对称。峰度系数:用于描述数据分布峰值高低,大于0 为尖峰,5小于 0 为扁平分布。二、 (20 分)简要说明 t 分布和 F 分布在推断统计中应用。t 分布:当正态总体标准差未知时,在小样本的条件下对总体均值的估计和检验要用到 t 分布。描述样本均值分布,用于对两个样本均值差异进行显著性测试、估算置信区间等。F 分布:通常用于比较不同总体的方差是否有显著差异。应用于方差分析、协方差分析和回归分析等, 还可用于似然比检验。三、 (20 分)什么是 P 值?要证明原假设不正确,如何确定合理的 P
10、 值?P 值:犯第 I 类错误的真实概率,也称观察到的显著性水平。是当原假设为真时, 得到的样本结果会像实际观测结果这样极端或者更极端的概率。若要证明原假设不正确, 则由样本得到的 P 值应小于给定的显著性水平。四、 (20 分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30 名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:方差分析表差异源SSdfMSFP-value6组间2100.245946组内38362总计(1) 完成上面的方差分析表。(2) 组装方法与组装产品数量之间的关系强度如何?(3) 若显
11、著性水平 0.05 ,检验三种方法组装的产品数量之间是否有显著差异?(1)差异源SSdfMSFP-value2*210=420I-1=22102100.24594组间142.076= 1.47830-3=2组内38367420+3836总计29=4256383627=142.07(2)从 P 值来看,组装方法与组装产品数量之间的关系强度较弱。(3)原假设:三种方法每小时组装的产品数量没有差异若显著性水平为 0.05,则 P0.05,因此不能拒绝原假设,即不能证明三种方法组装的产品数量之间有显著差异。五、 (20 分)简要说明分解预测的基本步骤。第 1 步,确定并分离季节成分。 计算季节指数,