《回顾性临床研究的设计和分析.pptx》由会员分享,可在线阅读,更多相关《回顾性临床研究的设计和分析.pptx(51页珍藏版)》请在优知文库上搜索。
1、回顾回顾性临床研究的设计性临床研究的设计与数据分析与数据分析1NP-OBC-2015.11-002 Valid Until 2017.11声明声明 本资料为仅用于学术会议或活动的专业资本资料为仅用于学术会议或活动的专业资料,旨在促进医药信息的沟通和交流,仅料,旨在促进医药信息的沟通和交流,仅供医药卫生专业人士参考。内容可能含有供医药卫生专业人士参考。内容可能含有未在中国批准的临床适应症。处方请参考未在中国批准的临床适应症。处方请参考国家食品药品监督管理总局批准的药品说国家食品药品监督管理总局批准的药品说明书明书2前瞻性前瞻性 vs.回顾性回顾性 时间顺序性时间顺序性 研究问题 vs. 数据收集
2、 暴露因素 vs. 研究结局 数据的分析永远是回顾性的数据的分析永远是回顾性的 数据的产生永远是前瞻性的数据的产生永远是前瞻性的3常见的回顾性研究设计常见的回顾性研究设计 一般为观察性研究一般为观察性研究 回顾性队列研究(因回顾性队列研究(因 果)果) 病例对照研究(病例对照研究( 果果 因)因) 横断面研究横断面研究4队列研究队列研究暴露暴露时间轴时间轴一组人一组人前进前进结局结局5队列研究队列研究暴露暴露时间轴时间轴一组人一组人前进前进结局结局现在现在回顾性回顾性现在现在前瞻性前瞻性6因因 果果队列研究队列研究可以回答哪些问题?可以回答哪些问题? 疾病(事件)的疾病(事件)的发生发生情况:
3、发生率情况:发生率 疾病(状态)的疾病(状态)的流行或流行或分布:百分数分布:百分数 疾病(事件、状态)发生、流行和分布的疾病(事件、状态)发生、流行和分布的影响因素:比(影响因素:比(Hazard Ratio, Rate Ratio)7确定研究终点确定研究终点确定暴露因素确定暴露因素随访起止点随访起止点确定研究人群确定研究人群队列研究的设计要素队列研究的设计要素从暴露从暴露时间轴时间轴一组人一组人到结局到结局8前进前进确定研究问题确定研究问题随访随访 起点:起点: 暴露或者风险发生的起点 过去的某个时间点过去的某个时间点 终点:终点: 事件发生 失访或脱落 研究结束9过去的某个时间点过去的某
4、个时间点现在现在 or 过去的某过去的某个时间点个时间点确定研究人群确定研究人群 目标人群目标人群 源人群源人群 研究人群研究人群10从从研究起点(过去)进行选择研究起点(过去)进行选择确定暴露状态确定暴露状态 根据研究对象在根据研究对象在研究起点(过去)研究起点(过去)的暴露的暴露状态而确定的状态而确定的 暴露组 对照组 根据研究问题清晰定义根据研究问题清晰定义 有/无(治疗方案) 按暴露程度(剂量) 按暴露的Pattern(顺序)11对照组的选择对照组的选择 除了暴露因素外,应与暴露除了暴露因素外,应与暴露组相似组相似 内部对照内部对照 从同一地点,同一时间内选择。如从同一家医院,在同一个
5、时间段内选择 外部对照外部对照 不同地点,不同时间 需要更强的相似性假设12暴露组与对照组的可比性暴露组与对照组的可比性 观察性研究的特性决定了暴露组与对照组观察性研究的特性决定了暴露组与对照组是不可比的是不可比的 基线的背景风险不同(选择性入组) 脱落者与在访者的背景风险不同(选择性脱落) 忽略这种不同会影响我们对结果的解读忽略这种不同会影响我们对结果的解读“选择性偏倚选择性偏倚”13随机随机(Randomization)举例:死亡率指标举例:死亡率指标“二、三级综合医院医疗服务能力标准二、三级综合医院医疗服务能力标准”征求意见征求意见稿稿14住院患者死亡率住院患者死亡率住院手术死亡率住院手
6、术死亡率三级医院0.8%1.4二级医院0.4%0.28“差异差异”的校正和控制的校正和控制 研究设计上研究设计上 研究实施上研究实施上 数据分析上数据分析上 结果解读上结果解读上 选择内部对照选择内部对照 尽可能尽可能收集风险因素收集风险因素 减少因失访导致的信息缺失减少因失访导致的信息缺失 分层分析分层分析 多变量分析多变量分析谨慎,避免结论性的论断谨慎,避免结论性的论断15队列研究的终点队列研究的终点/结局结局 事件的发生(事件的发生(已知已知) Time-to-event (OS, PFS) Disease incidence 随访终点(随访终点(已知已知) 一个队列研究可观察多个研究结
7、局一个队列研究可观察多个研究结局16结局和暴露状态的测量结局和暴露状态的测量 基本原则:独立与客观基本原则:独立与客观 研究结局不应影响暴露状态的判断 暴露状态不应影响研究结局的判断 观察性研究中不存在完全的独立与客观观察性研究中不存在完全的独立与客观 测量的误差会影响测量的误差会影响研究研究结果,无法校正结果,无法校正“信息偏倚信息偏倚”盲法盲法(Blinding)17回顾性队列研究中的回顾性队列研究中的选择性偏移与信息偏移选择性偏移与信息偏移 选择性偏移选择性偏移 选择性入组和脱落 回顾性数据的完整性 信息偏移信息偏移 回顾性数据的准确性 回忆的准确性 暴露状态对结局的影响相对较小18关于
8、关于失访失访 观察性研究的失访无法避免观察性研究的失访无法避免 对临床研究的影响对临床研究的影响 减少了样本量,降低研究的效力 造成选择性偏倚 应对措施应对措施 补充数据,减少失访造成的信息缺失 接受现实、评估可能的影响、谨慎解读结果19病例对照研究病例对照研究 研究结局(果)研究结局(果) 暴露状态(因)暴露状态(因) Step 1: 根据结局确定“病例”与“对照” Step 2: 确定各自的暴露状态 Step 3: 计算20病例对照研究病例对照研究21病例对照研究病例对照研究22病例病例病例对照研究病例对照研究23病例病例对照对照结局结局 暴露暴露24病例:病例:对照:对照:暴露暴露非暴露
9、非暴露病例病例对照对照Odds Ratio (OR)254422病例病例对照对照OR=病例对照研究病例对照研究可以回答哪些问题?可以回答哪些问题? 疾病或状态的影响因素(比较性问题)疾病或状态的影响因素(比较性问题) 保护因素 风险因素 唯一的产出:OR26病例对照研究的设计要素病例对照研究的设计要素 确定研究问题确定研究问题 确定研究人群确定研究人群 病例的选择 对照的选择 判断暴露状态判断暴露状态27病例的选择病例的选择 理论上,人群中所有病例均应作为理论上,人群中所有病例均应作为case 实际实际中,选择部分病例作为中,选择部分病例作为case 一般一般选择新发病例而非既往病例选择新发病
10、例而非既往病例 不同时期的诊断水平存在差异28对照的选择对照的选择 在选择时没有在选择时没有发生研究结局发生研究结局 与病例来自同一人群与病例来自同一人群 如果发生了研究结局,那么对照符合病例的入选标准 对照的选择不受暴露因素的影响对照的选择不受暴露因素的影响 除了暴露除了暴露因素外,对照应与病例类似因素外,对照应与病例类似 病例对照比例:病例对照比例:1:11:429判断暴露状态判断暴露状态 往往是回顾性的往往是回顾性的 基于已有病例档案(完整性?) 基于回忆(准确性?)30病例对照研究中的病例对照研究中的偏倚与混杂偏倚与混杂 选择性偏倚选择性偏倚 不恰当的选择对照(受暴露状态的影响) 病例
11、与对照来自不同人群 信息偏倚(暴露信息不准确)信息偏倚(暴露信息不准确) 回顾性的数据收集方式 回忆偏倚 研究者引入的偏倚 混杂混杂 风险因素数据不完整或缺失31病例对照研究中的病例对照研究中的偏倚与偏倚与混杂的控制混杂的控制 较队列研究更难控制较队列研究更难控制 可用的方法可用的方法 配对 尽可能收集风险因素 使用客观测量结果 分析:分层、多因素分析 承认承认其存在以及研究的局限性其存在以及研究的局限性32 研究问题:研究问题: MKK4基因多态性与结直肠癌的相关性 研究设计:研究设计: 病例对照33病例与对照的选择病例与对照的选择 病例病例 2002年6月2008年12月 广州地区6所医院
12、 706名组织病理学确诊CRC患者 对照对照 相同时间段 广州地区健康体检人群 随机选择723名无CRC研究对象 年龄、性别配对34Yisheng Wei, et al. Int. J. Cancer: 125, 18761883 (2009)暴露因素测量暴露因素测量 问卷:吸烟、饮酒、家族史问卷:吸烟、饮酒、家族史 采集血样进行基因分析采集血样进行基因分析35Yisheng Wei, et al. Int. J. Cancer: 125, 18761883 (2009)36横断面研究横断面研究37 了解了解某种疾病或状态某种疾病或状态在特定时间、某个人在特定时间、某个人群中的分布群中的分布状
13、态(流状态(流行率)行率)流行率流行率横断面研究横断面研究 特殊的病例对照研究特殊的病例对照研究 所有的non-case均选为control 相关因素分析(OR)38横断面研究的设计要素横断面研究的设计要素 确定研究人群确定研究人群 在哪个人群切? 确定数据收集确定数据收集/产生时间产生时间 在什么时候切?在什么时候切? 结局与暴露的测量结局与暴露的测量 数据收集39人群的切面人群的切面数据收集数据收集/产生时间产生时间 日历时间(日历时间(calendar time) X年X月X年X月 事件时间(事件时间(event time) 就诊、诊断、治疗、死亡40数据收集数据收集 同时收集暴露与结局
14、信息(一次性收集)同时收集暴露与结局信息(一次性收集) 收集方式:收集方式: 面对面访谈 邮寄调查问卷 电话访谈 自我填写的调查问卷 医学检查(实验室检查) 已有档案回顾41横断面研究的横断面研究的偏倚偏倚与混杂与混杂 选择性偏倚选择性偏倚:研究对象不具代表性:研究对象不具代表性 信息信息偏倚偏倚:基于回忆或自我报告:基于回忆或自我报告 混杂:风险因素缺失或未收集混杂:风险因素缺失或未收集42 研究人群:研究人群: 2010/7-2012/7 就诊乳腺癌患者 数据收集:数据收集: 病理科档案43常用的分析方法常用的分析方法 描述性分析(描述性分析(Descriptive analysis) 描
15、述研究人群的基本特征 组间比较(组间比较(Subgroup comparison) 了解可能存在的组间差异 回归分析(回归分析(Regression analysis) 偏倚与混杂的校正,分析影响因素44描述性分析描述性分析 根据变量类型选择分析方法根据变量类型选择分析方法变量类型变量类型描述性分析描述性分析连续变量连续变量 按连续变量报告按连续变量报告 平均数(平均数(SD, 95 CI) 中位数(中位数(Range, IQR) 转换成分类变量,如年龄段转换成分类变量,如年龄段 计数,百分比计数,百分比分类变量分类变量 计数、百分比计数、百分比45组间比较组间比较 比较组间基线特征差异比较组
16、间基线特征差异 t检验(连续变量) 卡方检验(分类变量) “我该使用哪种检验方法?我该使用哪种检验方法?”http:/www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm46 Dependent Variable: 因变量(年龄)因变量(年龄) Independent Variable: 自变量(治疗方案)自变量(治疗方案) Nature of Depend Variable Interval Normal Ordinal Categorical47使用的检使用的检验方法验方法四四种统计种统计软件的操软件的操作方法作方法回归分析回归分析 根据研究设计和因变量(结果变量)种类根据研究设计和因变量(结果变量)种类选择回归分析方法选择回归分析方法 生存分析(Cox回归):time-to-event变量 Logistic回归:0,1结果变量 线性回归:连续性结果变量 Poisson回归:非负的计数性结果变量 单变量单变量 vs. 多变量多变量48单因素与多因素分析单因素与多因素分析 单因素分析:单因素分析: Y=+X1 生存状态=+*治疗方案