《医学统计学 临床随访研究及分析.ppt》由会员分享,可在线阅读,更多相关《医学统计学 临床随访研究及分析.ppt(57页珍藏版)》请在优知文库上搜索。
1、 临床随访研究及分析临床随访研究及分析生存分析生存分析(survival analysis)实际问题n观察、比较两组肾移植病人手术后的生存时间和结局,在该研究中除考虑随访对象的结局(生存或死亡)外,还应考虑随访对象的“生存时间”,因为即使结局相同,而发生结局的快慢不同,仍可提示两组间存在差异n随访研究过程中研究对象可能会失访,或死于其他疾病,或因研究经费和时间的限制不可能等到所有的观察对象都出现结果才中止试验,这种现象称为截尾(censoring)或终检,截尾数据所提供的信息是不完全的(incomplete),但不考虑或不利用这类数据又是信息的损失 n生存分析生存分析(survival ana
2、lysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。n生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。前前 言言4.1 生存分析基本概念生存分析基本概念4.1.1生存时间生存时间 (survival time,failure time)n终点事件终点事件与与起始事件起始事件之间的时间间隔。之间的时间间隔。n终点事件指研究者所关心的特定结局。终点事件指研究者所关心的特定结局。n起始事件是反映研究对象生存过程的起起始事件是反映研究对象生存过程的起 始特征的事件。始特征的事件。生存时间举例生存时间举例 起始事件起始
3、事件 终点事件终点事件 服药服药 痊愈痊愈 手术切除手术切除 死亡死亡 染毒染毒 死亡死亡 化疗化疗 缓解缓解 缓解缓解 复发复发n终点事件和起始事件是相对而言的,终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,明确规定,并在研究期间严格遵守,不能随意改变。不能随意改变。4.1.2观察结果(outcome)n所谓观察结果就是我们关心的终点事件n在生存分析中称终检变量(censored variable)或死亡变量(dead variable)n当被观察对象出现终点事件记为1,否则记为0(统称为截尾)4.1.3生存时
4、间的类型生存时间的类型1.完全数据(complete data)从起点至死亡(死于所研究疾病)所经历的时间。出现结局事件2.截尾数据(删失数据,censored data)从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。例如:例如:某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、DureS分期等。随访截止日期为2000年12月30日,随访记录见下表。大肠癌患者的随访记录大肠癌患者的随访记录 编号编号 性别性别 年龄年龄 手术日期手术日期 随访终止日期随访终止
5、日期 随访结局随访结局 生存时间生存时间(天天)1 男男 45 1991.05.20 1995.06.04 死亡死亡 1476 2 男男 50 1992.01.12 1998.08.25 死亡死亡 2417 3 女女 36 1991.10.24 1994.03.18 失访失访 876+4 男男 52 1994.11.02 2000.12.30 存活存活 2250+5 女女 56 1994.06.25 1995.03.17 死亡死亡 265 6 女女 60 1993.12.05 1996.08.16 死于其它死于其它 985+生存时间生存时间n生存时间的度量单位可以是年、月、生存时间的度量单位可
6、以是年、月、日、小时等。常用符号日、小时等。常用符号t t表示,截尾数表示,截尾数据在其右上角标记据在其右上角标记“+”+”。n生存资料的主要特点:生存资料的主要特点:q含有截尾数据。含有截尾数据。q截尾数据的特点:真实的生存时间未知,截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。只知道比观察到的截尾生存时间要长。q生存时间的分布一般不呈正态分布。生存时间的分布一般不呈正态分布。例15.5 102名黑色素瘤患者的生存时间(月)如下 0.00.00.00.20.40.90.91.11.21.21.31.51.61.61.71.92.12.52.52.72.83.53.83
7、.93.93.94.04.14.24.24.34.44.54.64.74.95.25.85.85.96.06.06.16.26.36.76.76.97.07.37.47.47.77.77.88.08.08.38.48.58.79.39.810.110.510.511.011.111.412.513.313.313.513.813.813.814.615.916.116.116.518.019.320.020.520.621.221.521.822.223.624.324.425.425.826.528.028.729.336.436.542.0 频 数 time(Month)0 5 10 15
8、 20 25 30 35 40 45 0 10 20 30 40 102名黑色素瘤患者的生存时间的频数分布 4.2 常用观察指标及其估计 n半数生存时间(median survival time)表示50的个体存活且有50的个体死亡的时间 n102名黑色素瘤患者的中位生存时间为 M7.4(月)死亡概率(dead probability)n死亡概率指在某时间段内受试者死亡的可能性,记为 q.n与观察时间有关 生存概率(survival probability)n生存概率是指在某时间段内受试者生存的可能性,记为 p n与观察时间有关 n关系 同一时刻有:p=1-q 一般手术(A组):3915202
9、02630414664+64135223365450596+680+900+900+改进手术(B组):1070+70+120225366390+475+518+647+801+1001+1045+1045+某医院泌尿外科于1979-1982年间作了19例肾移植手术,拟了解肾移植后病人的生存时间(天)。规定随访开始时间为病人术后一天,死亡事件为该病人因与肾移植有关的各种原因而死亡。后改进手术方式,于1983-1986年又作了14例,资料如下(有+的数据表示该病人截尾)。n一般手术组患者,在20天前死亡3人,尚有16人活。n20天时有2名死亡,故20天时的死亡概率为2/16=0.125,生存概率为
10、1-0.125=0.875。n在64天前死亡9人,尚有10人存活,64天时失访1人,死亡1人,故64天时的死亡概率为1/10=0.1,生存概率为0.9。n到135天前,已死亡10人,失访1人,尚有8人确知存活。135天时,死亡1人,故135天时的死亡概率为1/8=0.125,生存概率为0.875 n生存函数生存函数(survival function),或累积生存,或累积生存概率概率(cumulative survival probability)指观察对象经历t个单位时段后仍存活的可能性。期初观察例数年例数活满年生存率55生存率生存率(survival rate)随访病人总数的病人数生存时间
11、ttTPtS)()(n102名黑色素瘤患者中的生存时间小于12个月的有69人,大于12个月的有33人,故其1年生存率为:。由于不同时间的生存人数不同,故不同时间的生存率不同%35.32102/33)12(tS 由例子可看出,生存率与生存概率不同,生存概率是单个时段的结果,而生存率实质上是累积生存概率(cumulative probability of survival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。n生存曲线(survival curve)以观察(随访)时间为横轴,以生存率为纵,将各个时间点所对应的生存率连接在一起的曲线图。生存曲线是
12、一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生存期。随访时间 0 5 10 15 20 25 30 35 40 45 0.00 0.25 0.50 0.75 1.00 生存率图15.8 102名黑色素瘤患者的生存率(Kaplan-Meier)估计n该法是Kaplan和Meier于1958年首先提出,故又称Kaplan-Meier法 n利用条件概率乘法原理来估计生存率,即:乘积-极限法(product-limit,PL)iippptS21)(一般手术组的生存概率和生存率的计算见下表 编号生存时间outcome死
13、亡概率生存概率生存率1311/1918/190.9473682911/1817/180.89473731511/1716/170.8421054,52012/1614/160.73684262611/1413/140.68421173011/1312/130.63157984111/1211/120.57894794611/1110/110.526316106411/109/100.47368411640010.4736841213511/87/80.4144741322311/76/70.3552631436511/65/60.2960531545011/54/50.236842165960
14、010.236842176800010.23684218,199000010.236842 随访时间 0 200 400 600 800 1000 0.00 0.25 0.50 0.75 1.00 group 1 group 2 生存率 图15.9 两组手术方式生存概率(Kaplan-Meier)曲线生存率的标准误 n用Greenwood法估计 ijjjjjiidnndtStSSE1)()()(nj表示时刻tj的期初观察人数,dj表示tj时刻的死亡人数 生存率的可信区间 n用正态近似法,即100(1-)可信区间为:)()(iitSSEutS例如20天时的生存率为nS(t=20)=0.7368,
15、标准误为:0101.0)216(162)117(171)118(181)119(1917368.0)20(tSSE95的可信区间为:0.73681.960.0101=(0.7170,0.7566)生存曲线的生存曲线的log-rank检验检验log-ranklog-rank检验(对数秩检验、时序检验)检验(对数秩检验、时序检验)n该检验属非参数检验,用于比较两组或多组生该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。存曲线或生存时间是否相同。n检验统计量为卡方。检验统计量为卡方。n自由度自由度=组数组数-1-1。nP0.05P0.05,两组或多组生存曲线不同。,两组或多组生存曲
16、线不同。P P0.050.05,两组或多组生存曲线差别无统计学,两组或多组生存曲线差别无统计学意义。意义。例15.7 对例15.2中两种手术方式下的肾移植病人的生存过程进行比较 n建立检验假设:H0:两组肾移植病人的生存过程相同;H1:两组肾移植病人的生存过程不同。n=0.05。n排秩次n计算各组在各观察时间的期初病例数 n计算各组在各观察时间的理论死亡人数 组别生存人数死亡人数合计期初观察人数A组18119B组14014合计32133观察时间为3时各组各时点期初生存人数和死亡人数四格表 5758.033119AT4242.033114BT各组理论死亡人数的计算与四格表中的理论数计算相同,组别group 生存时间死亡数期初病例数 理论死亡数 合计A组B组A组B组TimedNNAnBd*nA/nd*nB/n(1)(2)(3)(4)(5)(6)(7)(8)A313319140.57580.4242A913218140.56250.4375B1013117140.54840.4516A1513017130.56670.4333A2022916131.10340.8966A2612714130