第十七章:生存分析(理论)



《第十七章:生存分析(理论)》由会员分享,可在线阅读,更多相关《第十七章:生存分析(理论)(58页珍藏版)》请在文档大全上搜索。
1、问题1 在你学过的统计方法中,对于不能痊愈在你学过的统计方法中,对于不能痊愈的慢性病治疗效果的考核可用什么指标的慢性病治疗效果的考核可用什么指标和统计方法?和统计方法? (其结局都是死亡)(其结局都是死亡)引出新概念:生存时间 不仅要考察不仅要考察结局结局的好坏,还要考察经历的好坏,还要考察经历的的时间时间长短。长短。 对于能治愈疾病,看治愈时间的长短,对于能治愈疾病,看治愈时间的长短,对于不能治愈的疾病,看延长生存时间对于不能治愈的疾病,看延长生存时间的长短。的长短。问题2 采用随访研究可以研究生存时间,但此采用随访研究可以研究生存时间,但此时失访问题不可避免,怎么办?时失访问题不可避免,怎
2、么办? 例如例如,使用生存率(或有效率)指标,分使用生存率(或有效率)指标,分子是什么?分母是什么?子是什么?分母是什么?以3年生存率为例 3年期满的某病生存人数年期满的某病生存人数/期初某病观察期初某病观察总人数总人数 3年期满的某病生存人数年期满的某病生存人数/3年期满的某病年期满的某病观察总人数观察总人数 对象在期间失访如何处理?对象在期间失访如何处理?对上述对上述2个问题的解决办法个问题的解决办法p 应用一类对生存时间进行的统计分应用一类对生存时间进行的统计分析析生存分析:包括生存分析:包括生存率估计(乘积极限法和寿命表法)生存率估计(乘积极限法和寿命表法)生存率比较(生存率比较(lo
3、g-rank检验和检验和Breslow检验)检验)Cox模型模型第十七章第十七章生存分析生存分析第一节第一节 基本概念基本概念 在医学在医学, ,生物学研究中生物学研究中, ,常用到生存常用到生存分析分析 (Survival Analysis)(Survival Analysis)方法。例如方法。例如对于肿瘤等疾病的疗效及预后的考核对于肿瘤等疾病的疗效及预后的考核, ,通通常不用治愈率,有效率等表示,而用将常不用治愈率,有效率等表示,而用将来复发或死亡的时间长短表示来复发或死亡的时间长短表示, ,也即生存也即生存时间来表示。时间来表示。 所谓生存时间(所谓生存时间(survival times
4、urvival time)是)是指从某个标准时刻指从某个标准时刻( (如发病如发病, ,确诊确诊, ,开始治开始治疗或进行手术的时间疗或进行手术的时间) )算起至死亡或复发算起至死亡或复发为止的时间。为止的时间。 生存分析数据的三个特点:生存分析数据的三个特点:1.1.随访观察获得,同时考虑生存时间和生存结局随访观察获得,同时考虑生存时间和生存结局 2.2.有截尾数据(有截尾数据(censored data)censored data) 随访中未能知道病人的确切生存时间,只知随访中未能知道病人的确切生存时间,只知道病人的生存时间大于某时间。道病人的生存时间大于某时间。(1 1)病人失访或因其他
5、原因而死亡)病人失访或因其他原因而死亡-失访失访(2 2)到了研究的终止期病人尚未死亡)到了研究的终止期病人尚未死亡-终访终访截尾数据截尾数据可记为可记为t t+ +, ,如:如: 4 4+ + = = 生存时间大于生存时间大于4 4年。年。 虽然虽然截尾数据提供的信息是不完全的,但不截尾数据提供的信息是不完全的,但不能删去,因为这不仅损失了资料,而且会造成偏能删去,因为这不仅损失了资料,而且会造成偏性。性。3. 生存期的资料一般不服从正态分布。生存期的资料一般不服从正态分布。 由于上述原因,常用的统计方法不适用,而由于上述原因,常用的统计方法不适用,而要用特殊的统计方法。要用特殊的统计方法。
6、 生存分析是指对于生存时间这一指标进行分生存分析是指对于生存时间这一指标进行分析的一系列特殊的统计方法。析的一系列特殊的统计方法。例17-1 为了估计为了估计HIV(人类免疫缺陷病毒)阳性(人类免疫缺陷病毒)阳性患者的生存时间,某研究者进行了临床随访研患者的生存时间,某研究者进行了临床随访研究。研究对象是于究。研究对象是于2002年年1月月1日至日至2004年年12月月31日期间在某市确诊为日期间在某市确诊为HIV阳性者,随访这阳性者,随访这些对象直至死于些对象直至死于AIDS(艾滋病)或其并发症(艾滋病)或其并发症(status=1为死亡,为死亡,0为删失),研究截止日为删失),研究截止日期
7、为期为2008年年12月月31日。并记录每个研究对象日。并记录每个研究对象的性别(的性别(sex=1为男,为男, 0为女)、年龄(为女)、年龄(age,岁)、是否用药(岁)、是否用药(drug=1为用药,为用药,0为不用)。为不用)。表表17-1 10017-1 100名名HIVHIV阳性患者的生存时间(月)及阳性患者的生存时间(月)及其影响因素其影响因素 ID entdate enddate time sex age drug status 12004-10-72005-8-7100 27 1 1 22002-6-292002-7-29 10 47 1 0 32004-8-22005-1-1
8、 51 40 1 1 42004-4-52007-2-3341 37 0 1 52004-10-12004-10-31 10 33 1 1 62003-12-122004-1-11 10 42 1 1 72003-12-82008-9-5570 37 0 1 82003-2-142003-10-15 81 32 1 1 92002-1-102003-1-10120 37 1 0 10 2002-12-172004-7-15191 34 0 1 包括:包括:(1)(1)开始观察日期,终止观察日期开始观察日期,终止观察日期-生存时间生存时间(2)(2)结局(最终观察到的是死亡还是存活)结局(最终观
9、察到的是死亡还是存活) 死于该病死于该病-完全数据完全数据 存活或死于其他原因存活或死于其他原因-截尾数据截尾数据 每个生存期数据要用每个生存期数据要用2 2个变量表示:观察到的个变量表示:观察到的生存时间和是否截尾(如:用生存时间和是否截尾(如:用0 0表示截尾,用表示截尾,用1 1表示死亡;表示死亡;4 4+ + 用用4 4,0 0表示;表示;4 4用用4 4,1 1表示)。表示)。(3)(3)协变量协变量-各种影响生存期长短的因素。各种影响生存期长短的因素。随访资料的记录随访资料的记录-生存分析的数据生存分析的数据结构和要求结构和要求一、生存时间一、生存时间 是一个广义的概念,是一个广义
10、的概念,生存时间不一定专用于死生存时间不一定专用于死与活的情况与活的情况, ,生存时间生存时间( (存活时间存活时间) )可定义为从可定义为从某种起始事件到达某终点事件所经历的时间跨某种起始事件到达某终点事件所经历的时间跨度。度。 例如:例如:l 急性白血病病人治疗急性白血病病人治疗- -复发之间的缓解期复发之间的缓解期; ;l 冠心病病人在两次发作之间隔冠心病病人在两次发作之间隔; ;l 已作输卵管结扎的妇女从施行输卵管吻合手术后至受孕的时间间隔已作输卵管结扎的妇女从施行输卵管吻合手术后至受孕的时间间隔; ;l 在流行病学研究中在流行病学研究中, ,从开始接触危险因素到发病所经历的时间;从开
11、始接触危险因素到发病所经历的时间;l 住院到出院之间所花费的医疗费用;住院到出院之间所花费的医疗费用;l 从购买到失效期间某医疗设备被使用的次数;从购买到失效期间某医疗设备被使用的次数;l 从购买到第一次维修某车辆所行驶的总里程等。从购买到第一次维修某车辆所行驶的总里程等。l 结婚到离婚结婚到离婚l 投保投保( (人寿保险人寿保险) )到死亡到死亡l 开始戒烟开始戒烟( (毒毒) )到再次吸烟到再次吸烟( (毒毒) )l 。l 展开你的想象力,专业应用领域很广!展开你的想象力,专业应用领域很广! 结局(终点事件)的理解结局(终点事件)的理解l 死亡(生存)死亡(生存)l 复发(白血病、第二次心