
《海量版】《卫生统计学》试卷及答案5》由会员分享,可在线阅读,更多相关《海量版】《卫生统计学》试卷及答案5(67页珍藏版)》请在文档大全上搜索。
1、?卫生统计学?一、名词解释1. 计量资料2. 计数资料3. 等级资料4. 总体5. 样本6. 抽样误差7. 频数表8. 算术均数9. 中位数10. 极差11. 方差12. 标准差13. 变异系数14. 正态分布15. 标准正态分布16. 统计推断17. 抽样误差18. 标准误19. 可信区间20. 参数估计21. 假设检验中P的含义22. I型和II型错误23. 检验效能24. 检验水准25. 方差分析26. 随机区组设计27. 相对数28. 标准化法29. 二项分布30. Yates校正31. 非参数统计32. 直线回归33. 直线相关34. 相关系数35. 回归系数36. 人口总数37.
2、老年人口系数38. 围产儿死亡率39. 新生儿死亡率40. 婴儿死亡率41. 孕产妇死亡率42. 死因顺位43. 人口金字塔二、单项选择题 1观察单位为研究中的( D )。A样本 B 全部对象C影响因素 D 个体2总体是由 C 。A个体组成 B 研究对象组成C同质个体组成 D 研究指标组成3抽样的目的是 B 。A研究样本统计量 B 由样本统计量推断总体参数C研究典型案例研究误差 D 研究总体统计量4参数是指 B 。A参与个体数 B 总体的统计指标C样本的统计指标 D 样本的总和5关于随机抽样,以下那一项说法是正确的 A 。A抽样时应使得总体中的每一个个体都有同等的时机被抽取B研究者在抽样时应精
3、心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好6各观察值均加或减同一数后 B 。 A均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变7比拟身高和体重两组数据变异度大小宜采用 A 。 A变异系数 B方差C极差 D标准差8以下指标中 D 可用来描述计量资料的离散程度。A算术均数 B几何均数 C中位数 D标准差9血清学滴度资料最常用来表示其平均水平的指标是 C 。A算术平均数 B中位数C几何均数 D平均数10两样本均数的比拟,可用 C 。A方差分析 Bt检验C两者均可 D方差齐性检验11配伍组设计的方差分析中,配伍等于 D
4、 。A总-误差 B总-处理C总-处理+误差 D总-处理-误差12在均数为,标准差为的正态总体中随机抽样, B 的概率为5%。 A B C D. 13完全随机设计方差分析的检验假设是 D 。A各处理组样本均数相等 B各处理组总体均数相等C各处理组样本均数不相等 D各处理组总体均数不全相等14男性的钩虫感染率高于女性。今欲比拟甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比拟方法是 D 。A分别进行比拟 B两个率比拟的2检验C不具备可比性,不能比拟 D对性别进行标准化后再比拟15率的标准误的计算公式是 D 。A B 16非参数统计应用条件是 C 。A总体是正态分布B假设两组比
5、拟,要求两组的总体方差相等C不依赖于总体分布D要求样本例数很大17下述哪些不是非参数统计的特点 D 。A不受总体分布的限定 B多数非参数统计方法简单,易于掌握C适用于等级资料 D检验效能总是低于参数检验18设配对设计资料的变量值为X1和X2,那么配对资料的秩和检验 A 。A把X1与X2的差数绝对值从小到大编秩B把X1和X2综合从小到大编秩C把X1和X2综合按绝对值从小到大编秩D把X1与X2的差数从小到大编秩19秩和检验和t检验相比,其优点是 A 。A计算简便,不受分布限制 B公式更为合理C检验效能高 D抽样误差小20对两样本均数作比拟时,n1、n2均小于30,总体方差不齐且分布呈偏态,宜用 C
6、 。At检验 Bu检验C秩和检验 DF检验21等级资料的比拟宜用 B 。At检验 B秩和检验CF检验 D四格表X2检验22两个小样本比拟的假设检验,应首先考虑 D 。At检验 B秩和检验C任选一种检验方法 D资料符合哪种检验的条件23对于配比照拟的秩和检验,其检验假设为 B 。A样本的差数应来自均数为0的正态总体B样本的差数应来自均数为0的非正态总体C样本的差数来自中位数为0的总体D样本的差数来自方差齐性和正态分布的总体24用最小二乘法确定直线回归方程的原那么是各观察点( B )。A距直线的纵向距离相等B距直线的纵向距离的平方和最小C与直线的垂直距离相等D与直线的垂直距离的平方和最小25实验设
7、计的三个根本要素是D。A 受试对象、实验效应、观察指标 B 随机化、重复、设置对照C 齐同比照、均衡性、随机化 D 处理因素、受试对象、实验效应26实验设计的根本原那么 D 。A 随机化、盲法、设置对照 B 重复、随机化、配对C 随机化、盲法、配对 D 随机化、重复、设置对照27 实验设计和调查设计的根本区别是 D 。A实验设计以动物为对象 B调查设计以人为对象C实验设计可随机分组 D实验设计可人为设置处理因素28. 标准正态分布的均数与标准差分别为( A )。A0与1 B1与0 C0与0 D1与129正态分布有两个参数与,( C )相应的正态曲线的形状越扁平。A越大 B越小 C越大 D越小3
8、0假设X服从以,为均数和标准差的正态分布,那么X的第95百分位数等于( B )。A B C D三、简答题1. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?2. 简述医学中参考值范围的涵义及制定参考值范围的一般步骤。3. 假设检验时,当,那么拒绝,理论依据是什么?4. t检验和方差分析的应用条件?5. 应用相对数时应注意哪些问题?6. 为什么不能以构成比代率?请联系实际加以说明。7. 应用直线回归和相关分析时应注意哪些问题?8. 统计表有哪些要素构成?制表的考前须知有哪些?9. 调查设计
9、包含哪些内容?10. 实验设计的根本内容和步骤。11. 诊断试验的设计主要包括哪些程序和内容?四、分析计算题1. 假定正常成年女性红细胞数近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:1变量X落在区间4.00,4.50内的概率;2正常成年女性的红细胞数95%参考值范围。2某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对;随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见表1第1、2、3栏。试比拟两组猪脑组织钙泵的含量有无差异。表1 两组乳猪脑组织钙泵含量(m g/g)乳猪号(1)对照组(2)
10、试验组(3)差值d(4)=(2)-(3)1234567合计0863某医院比拟几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:该资料属何种资料?实验设计属何种设计?欲比拟3种疗法的疗效的差异,宜选用何种假设检验方法?写出该种检验方法的与;假设求得的检验统计量为8.143,相应于的检验统计量的临界值为5.99,你如何做出结论?根据你的结论,你可能犯哪一类统计错误?4为比拟胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜
11、下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?5试就表2资料分析比拟甲、乙两医院乳腺癌手术后的5年生存率。表2 甲、乙两医院乳腺癌手术后的5年生存率%腋下淋巴结 转 移甲 医 院乙 医 院病例数生存数生存率病例数生存数生存率无4535300215有7104508342合计7554853832576某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116mg/L,血铅均数为1.81mg/L。服用果胶20天后再测,尿铅均数降为0.087mg/L,血铅均数降为0
12、.73mg/L,说明果胶驱铅的效果较好。请评述以上研究。参考答案一、名词解释1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料measurement data。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料count data。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料ordinal data。等级资料又称有序变量。
13、4. 总体:总体population指特定研究对象中所有观察单位的测量值。5. 样本:从总体中随机抽取局部观察单位,其测量结果的集合称为样本sample。6. 抽样误差:抽样误差sampling error是指样本统计量与总体参数的差异。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度频数。8. 算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用表示。9. 中位数:将一组观察值由小到大排列,位次居中的那个数。10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算
14、简便但稳定性较差。11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比拟。14. 正态分布:假设资料的频率曲线对应于数学上的正态曲线,那么称该资料服从正态分布。通常用记号表示均数为,标准差为的正态分布。15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为。16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。17.
15、 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。18. 标准误:通常将样本统计量的标准差称为标准误。19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。21. 假设检验中P的含义:指从H0规定的总体随机抽得等于及大于或等于及小于现有样本获得的检验统计量值的概率。22. I型和II型错误:I型错误指拒绝了实际上成立的H0,这类“弃真的错误称为I型错误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪的错误称为II型错误,其概率大小用表示。2
16、3. 检验效能:1-称为检验效能,它是指当两总体确有差异,按规定的检验水准所能发现该差异的能力。24. 检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差异的结论时犯错误的概率称为检验水准,记为。25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个局部,除随机误差外,其余每个局部的变异可由某个因素的作用或某几个因素的交互作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。26. 随机区组设计:事先将全部受试对象按自然属性分为假设干区组,原那么是各区组内的受试对象的
17、特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相比照。28. 标准化法是常用于内部构成不同的两个或多个总率比拟的一种方法。标准化法的根本思想就是选定一个统一“标准标准人口构成比或标准人口数,然后按选定“标准计算调整率,使之具备可比性以后再比拟,以消除由于内部构成不同对总率比拟带来的影响。29. 二项分布:假设一个随机变量X,它的可能取值是0,1,n,且相应的取值概率为, 那么称此随机变量X服从以、为参数的二项分布。30
18、. Yates校正:英国统计学家Yates F认为,由于分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对值作连续性校正correction of continuity,这一校正即所谓的Yates校正Yates correction。31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法non-parametric stat
19、istics,或称为不拘分布distribution-free statistics的统计分析方法,又称为无分布型式假定assumption free statistics的统计分析方法。32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最根本、最简单的一种,故又称简单回归。33. 直线相关:是用来描述具有直线关系的两变量x、y间的相互关系。34. 相关系数:又称积差相关系数,以符号r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。35. 回归系数: 为直线的
20、斜率,其统计学意义是自变量x改变一个单位时,应变量y平均变化个单位。36. 人口总数:人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总和。国际上统计人口数有两种方法: 实际制(de facto):即只统计标准时刻某地实际存在的人口数(包括临时在该地的人)。 法定制(de jure):只统计某地的常住人口。37. 老年人口系数:是指65岁及以上老年人口数占总人口数的比重。 。老年人口系数用于说明一个国家或地区的人口老龄化程度,其大小受社会经济开展水平、生活水平、卫生保健水平等因素的影响。38. 围产儿死亡率:围产期是指胎儿体重到达1000克及以上、或孕期满28周,至
21、出生后7天以内的时期。在此期间的死亡称为围产儿死亡。计算式为: 。围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。39. 新生儿死亡率:新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产数中未满28天的新生儿死亡数。计算式: 新生儿死亡在婴儿死亡中占很大的比重。死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。40. 婴儿死亡率:指某年平均每千名活产中不满1周岁(婴儿)的死亡数。计算式为:41. 孕产妇死亡率:指某年由于怀孕和分娩及并发症造成的孕产妇
22、死亡人数与同年出生活产数之比,常以万分率或十万分率表示,计算式为: 42. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。43. 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。二、单项选择题1D2C3B4B5A6B7A8D9C10C11D12B13D14D15D1
23、6C17D18A19A20C21B22D23B24B25D26D27D28A29C30B四、简答题1答题要点:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原那么进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数上下就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。2答题要点: 医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围,也叫正常值范围。所谓“正常人不是指完全健康的人,而是指排除了所研究资料的疾病
24、和有关因素的同质人群。制定参考值范围的一般步骤:1定义“正常人,不同的资料“正常人的定义也不同。2选定足够数量的正常人作为研究对象。3用统一和准确的方法测定相应的资料。4根据不同的用途选定适当的百分界限,常用95%。5根据此资料的实际意义,决定用单侧范围还是双侧范围。6根据此资料的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。3答题要点:P值系由H0所规定的总体做随机抽样,获得等于及大于或等于及小于依据现有样本信息所计算得的检验统计量的概率。当P005时,说明在H0成立的条件下,得到现有检验结果的概率小于,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。同时,下“有差异的结
25、论的同时,我们能够知道可能犯错误的概率不会大于,也就是说,有了概率保证。4答题要点:t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。5答题要点: 应用相对数时应注意的事项有: 计算相对数的分母一般不宜过小。 分析时不能以构成比代替率。 不能用构成比的动态分析代替率的动态分析。 对观察单位数不等的几个率,不能直接相加求其总率。 在比拟相对数时应注意可比性。 对样本率或构成比的比拟应随机抽样,并做假设检验。6答题要点:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成局部的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50
26、60岁年龄组的高血压病例占52.24%,所占比重最大,60岁组那么只占到6.74%。这是因为60岁以上受检人数少,造成患病数低于5060岁组,因而构成比相对较低。但不能认为年龄在5060岁组的高血压患病率最严重,而60岁以上反而有所减轻。假设要比拟高血压的患病率,应该计算患病率指标。7答题要点:注意以下五个问题作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常
27、点。直线回归方程的应用范围一般以自变量的取值范围为限。假设无充分理由证明超过自变量取值范围外还是直线,应防止外延。双变量的小样本经t检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。8答题要点:一般说来,统计表由标题、标目、线条、数字四局部构成有时附有备注。编制统计表的考前须知:(1) 标题概括表的内容,写于表的上方,通常需注明时间与地点。(2) 标目以横、纵标目分别说明主语与谓语,文字简明,层次清楚。(3) 线条不宜过多,通常采用三条半线表示,即顶线
28、、底线、纵标目下的横隔线及合计上的半条线。(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致,数次要对齐。表内不留空格。(5) 备注不要列于表内,如有必要,可在表内用“ * 号标记,并在表外加以说明。9一个完整的调查设计应包括以下内容:确定明确的调查目的;确定调查对象和观察单位;确定调查方法;确定调查指标和变量;确定调查工具和设计调查表;确定样本含量;调查员的选择和培训;调查的组织方案;涉及伦理道德方面问题的处理。10答题要点:实验设计的根本内容和步骤1建立研究假设:在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。根据研究目确实定本研究需要解决的
29、主要问题及相应的辅助问题。2明确研究范围:审慎考虑规定适当的纳入标准和排除标准,选择适宜本次实验的受试对象。3确立处理因素:分清处理因素和非处理因素,并注意处理因素的标准化。4明确观察指标:选用客观性较强,易于量化,灵敏性和特异性均较高的指标。5控制误差和偏倚:采取各种有效措施控制误差error和偏倚bias,使处理措施的效果能够真正的表达出来。11.答题要点:诊断试验的设计主要包括哪些程序和内容:(1)确定金标准:诊断试验的金标准是指目前公认的最可靠、最准确、最好的诊断方法,也称标准诊断方法,用来衡量新的诊断试验是否符合真实情况。临床上常用的金标准有组织病理学检查(活检、尸检)、手术发现、影
30、像诊断(CT、核磁共振、彩色B超)、细菌培养以及长期随访所得的结论。2选择研究对象:诊断试验的研究对象应包括两组:一组是用金标准确定为有某病的病例组,另一组是用金标准证实为无该病的患者或人群,作为对照组。病例组应包括各种病例,如病症典型和非典型的,病程早、中、晚期的,病情轻、中、重型的,年龄不同层次的等,以便能反映该病的全部特征。对照组应包括确实无本病而患有易与本病相混淆疾病的病例,这样的对照才具有临床鉴别诊断价值。3同步盲法测试:经金标准确定的病例与对照两组中的受试者同步接受新诊断试验方法的测定,将测定结果与金标准判定的结果进行比拟,计算新诊断试验与金标准符合和差异程度的统计学指标,再根据这
31、些指标对新诊断试验进行评价。在试验操作的全过程和判定试验结果时,采用盲法(尽可能用双盲法)是保证诊断试验结果真实可靠的关键,即观察者(和受试者)不能预先知道何为金标准确定的病例或对照,以免发生人为偏差,过高或过低估计新诊断试验与金标准的符合程度。四、分析计算题1解:(1)根据题意,变量X近似服从正态分布,求变量X落在区间4.00,4.50内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量进行标准化变换后,借助标准正态分布表求其面积,具体做法如下: 变量落在区间(4.00,4.50)内的概率为0.5967。(2)因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范
32、围,又因该资料过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:下限为:上限为:95%的正常成年女性红细胞数所在的范围是。2解:本例属异体配对设计,所得数据为配对计量资料,用配对t检验进行处理。1建立检验假设,确定检验水准H0:md0H1:md0a =。 2计算检验统计量n=7, 3确定P值,作出推断结论按n= n-1=7-1=6查t界值表,得t25,6=2.447,t<t25,6,那么P>,按a =水准不拒绝H0,差异无统计学意义,即按现有样本缺乏以说明脑缺氧乳猪钙泵平均含量与对照组不同。3解: 该资料属计数资料,实验设计属完全随机设计; 宜选用R×C表的检验方
33、法; :3种疗法的总体有效率相等:3种疗法的总体有效率不全相等 在的水准上,拒绝,接受,差异有统计学意义,可认为3种疗法的总体有效率不全相等,即3种疗法对慢性胃炎病人的疗效有差异。 可能犯I型错误。4解:(1) 根据题意,该设计为配对设计,首先将20例病人按年龄、性别、病型和病情等条件进行配对后,将10对患者从1到10编号,再任意指定随机排列表中的任一行,比方第8行,舍去1020,将随机数排列如下,规定逢单数者每对中的第1号试验对象进入胃舒氨组(A),第2号对象进入西米替丁组(B),逢双数者那么相反。分组情况如下所示:表1 20例病人配对入组情况病 人 号随机数字3261809547入组情况A
34、BBABBAABABAABAABBAB (2) 首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式见表2。本试验的目的在于比拟胃舒氨与西米替丁治疗消化性胃溃疡有效率的差异,应选用配对四格表的McNemar检验进行统计分析。表2 20位患者治疗情况西米替丁胃舒氨合计有效无效有效aba+b无效cdc+d合 计a+cb+dN5解:两医院乳腺癌患者的病情构成不同,比拟两医院的标准化率,计算过程见表3。表3 甲、乙两医院乳腺癌手术后的5年生存率的标化以甲乙两医院合计为标准腋下淋巴结转移标准病例数Ni甲 医 院乙 医 院原生存率pi预期生存人数Nipi=
35、原生存率Pi预期生存人数Nipi=无345268247有合计7935034011138Ni771Nipi648Nipi甲医院乳腺癌手术后的5年生存率的标化生存率:乙医院乳腺癌手术后的五年生存率标化生存率:因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的5年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。6解:人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。?卫生统计学?试卷及答案 第1题: 以下有关等级相关系数ts的描述中不正确的选项是 A.不服从双变量正态分布的资料宜计算rS B.等级数据宜计算rs C. rs值-1+1之间 D.查rs界值
36、表时, rs值越大,所对应的概率P值也越大 E.当变量中相同秩次较多时,宜计算校正rs值,使rs值减小 第2题:对某样本的相关系数r和0的差异进行检验,结果t1t0.05n-2,因此 B.两变量存在直线相关的可能性小于5% C.两变量肯定不存在相关关系 D.两变量间存在相关关系 第3题: 总体率95%可信区间的意义是。 A.95%的正常值在此范围 B.95%的样本率在此范围 C.95%的总体率在此范围 D.总体率在此范围内的可能性为95% E.样本率在此范围内的可能性为95% 第4题:样本含量确实定下面哪种说法合理。 A.样本越大越好 B.样本越小越好 C.保证一定检验效能条件下尽量增大样本含
37、量 D.保证一定检验效能条件下尽量减少样本含量 E.越易于组织实施的样本含量越好 直线相关与回归分析中,以下描述不正确的选项是。 A.r值的范围在-1+1之间 0的总体,那么r0表示正相关, r0表示负相关 C.Y和X相关,那么必可计算其直线回归方程 D.回归描述两变量的依存关系,相关描述其相互关系 E.r无单位 第6题: 四格表2检验的自由度为1,是因为四格表的四个理论频数 A.受一个独立条件限制 B.受二个独立条件限制 C.受三个独立条件限制 D.受四个独立条件限制 第7题: 对同一双变量X,Y的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。 A. tbtr B. tb=tr
38、 C. tbtr D. tbtr E. 视具体情况而定 第8题: 为了由样本推断总体,样本应该是。A.总体中任意的一局部 B.总体中的典型局部 C.总体中有意义的一局部 D.总体中有价值的一局部 第9题: 以下检验方法属非参数法的是。 A.T检验 B.t检验 C.u检验 D.F检验 E.以上都是 第10题:作两次数比拟,n1、n2均小于30,总体方差不齐且分布呈极度偏态,宜用。 A.t检验 B.u检验 C.秩和检验 D.F检验 E.2检验第11题: 对计数资料进行统计描述的主要指标是。 C.标准差 第12题: S-表示的是。 A.总体中各样本均数分布的离散情况 B.样本内实测值与总体均数之差
39、E.以上都不是 1 2 下页卫生统计学试题及答案一1.用某地616岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为_.【答案】C616岁为连续变量,得到的是连续变量的频数分布直方图适用于数值变量,连续性资料的频数表变量直条图适用于彼此独立的资料五年期间鼻咽癌死亡病例的年龄分布,可采用_.E.复式直条图(一个检测指标,两个分组变量)【答案】E?3.为了反映某地区20001974年男性肺癌年龄别死亡率的变化情况,可采用_.B.普通线图适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的开展变化趋势C.半对数线图适用于随时间变化的连续性资料,尤其比拟数值相差悬殊的多
40、组资料时采用,线段的升降用来表示某事物的开展速度【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。假设要研究该疫苗在该地儿童中的接种效果,那么_.【答案】D5.假设要通过样本作统计推断,样本应是_.【答案】C6.下面关于均数的正确的说法是_.A.当样本含量增大时,均数也增大【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝外表抗体滴度水平,欲描述其平均水平,宜采用_.【答案】B几何均数geometric mean是用于反映一组经对数转换后呈对称分布的变量值在数量
41、上的平均水平,在医学研究中常适用于免疫学的指标。对于变量值呈倍数关系或呈对数正态分布正偏态分布,如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等,宜用几何均数表示其平均水平。计算公式可用直接法和加减法。8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:_.D.大约有8人的潜伏期大于57.8小时(全体的百分之五,即是约有8人【答案】D9.以下说法中不正确的选项是_.D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内【答案】A10.两组数据中的每个变量值减去同一常数后,作两
42、个样本均数比拟的假设检验_.【答案】A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择_.【答案】D12.以下属于数值变量的是_.【答案】B13.以下关于样本的说法,不正确的选项是_.【答案】D14.以下属于分类变量的是_.【答案】D分类变量 在学术文献中的解释 1、分类变量是指地理位置、人口统计等方面的变量,其作用是将调查响应者分群.描述变量是描述某一个客户群与其他客户群的区别.大局部分类变量.15.在抽样研究中,当样本例数逐渐增多时_.【答案】D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_.年龄岁:102030405060人数
43、:6 4050 85 201【答案】C直方图适用于数值变量,连续性资料的频数表变量17.关于构成比,不正确的选项是_.B.构成比说明某现象发生的强度大小某现象发生的强度大小用“概率即“率表示D.假设内部构成不同,可对率进行标准化E.构成比之和必为100%【答案】B18.假设分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,那么采用_.【答案】C19.根据下述资料,样本指标提示_.甲疗法乙疗法病情病人数治愈数治愈率%病人数治愈数治愈率%轻型403690605490重型604270402870合计10078781008282D.此资料甲、乙疗法不能比拟【答案】C0.05水准,那么4种药物的抑瘤
44、效果和5个随机区组的瘤重的推断结论分别为_.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差异较大,不能认为区组间不同【答案】C卫生统计学试题及答案二1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义P<0.05,那么_.C.b有统计学意义(r有统计学意义,b也有统计学意义【答案】C2.关于基于秩次的非参数检验,以下说法错误的选项是_.A.符号秩和检验中,差值为零不参加编秩C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足
45、够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为_.A.P=1B.P=0P1E.0.5<P<0.5< P> 【答案】D4.两样本均数比拟,经t检验得出差异有统计学意义的结论时,P越小,说明_.【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_.【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,那么正确的选项是_.【答案】D7.方差分析中要求_.【答案】B8.比拟非典型肺炎和普通肺炎患者的白细胞计数水平,假设, 可作单
46、侧检验。【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为_.C.资料不具可比性,不能直接作比【答案】D10.比拟两个率时,不需要进行率的标准化的情况有_.【答案】B2检验不必校正_.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1<T<5< P> E.T>5且n<40【答案】C12.欲比拟三种药物的疗效无效、好转、显效、痊愈孰优孰劣,最好选择_.C.2检验两样本配对的计数资料卡方检验 D.秩和检验多样本的计数资料的秩和检验【答案】D13.下面说法中不正确
47、的选项是_.C.好的抽样设计方法,可防止抽样误差的产生 抽样误差不可防止D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等【答案】C14.实验设计和调查设计的根本区别是_.【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_.【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间_.【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于_.【答案】B18.在两独立样本比拟的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值
48、的秩应分别编为_.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1【答案】C19.两样本比拟的秩和检验两组样本例数相等,如果假设成立,那么对样本来说:_.答案:A 多组均数的秩和 有:各组的平均秩和近似相等医学统计学模拟试题一、单项选择题:在 A、B、C、D 和E 中选出一个最正确答案,将答案的字母填在相应下划线的空格里。 每题 1 分 1. 卫生统计工作的根本步骤包括 _。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描
49、述、统计估计和统计推断 2. 以下_不属于定量资料。 A. 体块指数(体重/身高 2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比拟身高与坐高两组单位相同数据变异度的大小,宜采用_。 A. 变异系数CVB标准差sC方差s2D极差RE四分位间距 5. 从 到.96s 范围外左右两那么外正态曲线下的面积是_ 。 2.5
50、% B95% C5.0% D99% E52.5% 6. 关于假设检验的以下论述中,错误的选项是_。 A. 在 A药降血压疗效只会比 B 药好或相等时, 可选单侧检验 B. 检验水准?定得越小, 犯 I型错误的概率越小 C. 检验效能 1-?定得越小, 犯 II型错误的概率越小 D. P 值越小, 越有理由拒绝 H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( )差异的 t 检验,_。 A. t 值不变. t 值变小. t 值变大 D. t 值变小或变大 . 不能判断 8. 将 90 名高血压病人随机等分成三组后分别用 A
51、、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比拟三种方法的效果是否相同,正确的选项是_ 。 A. 作三个样本两两间差值比拟的 t 检验 B. 作三个样本差值比拟的方差分析 C. 作服药前后配对设计资料的 t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对 9. 某医师治疗了两例视网膜炎患者,1 例有效,以下哪项说法是错误的:_。A. 有效率为 50最好用绝对数表示 必须用率表示时,应同时给出其可信区间 分母太小,用相对数不可靠 不能得知总体有效率 10. 经调查甲乙两地的冠心病粗死亡率均为 4/105,经统一年龄构成后,甲地标化率为 4.5/105,乙地为 3.8/
52、105。因此可认为 _ 。 A. 甲地人群平均年龄较乙地大 甲地人群实际冠心病死亡率较乙地高 C甲地老年人构成较乙地大 D甲地各年龄别冠心病死亡率都较乙地高 甲地人群冠心病平均死亡风险较乙地高 11不适宜用 Poisson分布描述的实例是_。 A广深高速公路一定时间发生的交通事故数分布 B.每毫升水样品中大肠杆菌数分布 C放射性物质在单位时间内放射出质点数分布 D单位空间中某些昆虫数分布 E一定人群中乙型肝炎病人数分布 12调查某地居民 1600 人,得蛔虫感染率为 50,那么其总体率的 95可信区间为 _。 A47.5552.45 B48.7551.25 C4555 D49.6850.32
53、E据此资料不可推知 13. 以下不是2 检验的用途。 A. 推断两个或两个以上总体率之间有无差异 B. 交叉分类资料两属性间有无相关关系 C. 检验频数分布与理论分布的拟合优度 D. 推断两个或两个以上总体构成比之间有无差异 E. 推断两个或两个以上总体均数之间有无差异 14在两组样本比拟的秩和检验中,实验组的观察值为 0,3,7,14,32,对照组的观察植为,0,2,4,4,8。编秩中零值的秩应分别编为 _。 A1; 2,3 B3; 1.5,1.5 C. 2; 2,2 D. 1; 2.5,2.5 E. 不参加编秩 15. 根据某地 6 至 16 岁学生近视情况的调查资料, 反映患者的年龄分布可用 _。 A.普通线图 B.半对数线图 C. 直方图 D. 直条图 E.复式直条图 16. 根据样本算得两个变量 X 与 Y 之间的相关系数 r,经 t 检验,P<0