《一流高校医学卫生综合部分必读复习材料 .docx》由会员分享,可在线阅读,更多相关《一流高校医学卫生综合部分必读复习材料 .docx(26页珍藏版)》请在优知文库上搜索。
1、9.胡良平样本含量估计以下内容摘自胡良平主编统计学三型理论在实验设计中的应用第17章样本含量估计目录17.1 确定样本含量的意义17.2 确定样本含量时应具备的条件17.3 检验效能的计算17.3.1 两组例数相等的样本频率比较时检验效能的计算17.3.2 两组例数不等的样本频率比较时检验效能的计算17.3.3 配对或交叉设计资料假设检验时检脸效能的计算17.3.4 两样本均数比较时检验效能的计算17.4 作区间估计时样本含量的估计17.4.1 估计总体均数时样本含量估计17.4.2 估计总体概率时样本含量估计17.5 作假设检验时样本含量估计17.5.1 单组设计、配对设计或交叉设计定量资料
2、统计分析时样本含量估计17.5.2 成组说滑稽定量资料统计分析时样本含量估计17.5.3 单因素多水平设计或完全随机区组设计定量资料统计分析时样本含量估计17.5.4 两样本频率比较时样本含量估计17.5.5 多个样本频率比较时样本含量估计17.5.6 配对设计四格表资料统计分析时样本含量估计17.5.7 直线相关分析时样本含量估计17.5.8 两样本相关系数比较时样本含量估计17.5.9 两样本生存频率比较时样本含量估计17.5.10 队列研究设计四格表资料统计分析时样本含量估计17.5.11 重复采样设计时样本含量估计17.5.12 重复测量设计时样本含量估计17.5.13 病例一对照研究
3、设计时样本含量估计17.5.14 临床试验设计时样本含量估计17.5.15 新药临床试验设计时样本含量估计17.5.16 多重回归分析时样本含量估计17.5.17 X检验时样本含量估计17.5.18 抽样调查设计时样本含量估计17.5.19 其它具体条件下的样本含量估计17.6 样本含量估计的计算机软件实现17.6.1 应用SAS(StatisticalAnalysisSystem)软件实现样本含量估计17.6.2 应用PASS(PowerAnalysisandSampleSize)软件包实现样本含量估计17.6.3 应用SamplePower软件实现样本含量估计17.6.4 应用简明统计20
4、00(ConciseStatistics2000,CS2000)实现样本含量估计17.6.5 应用SASALO医学研究样本含量估算系统实现样本含量估计17.7 样本含量估计便查表简介17.8 本章小结17.1 确定样本含量的意义正确地确定样本含量是实验设计中的一个重要内容。在估计样本含量时,应当注意克服两种倾向:一种是片面追求增大样本例数,认为样本例数越多越好,甚至提出“大量观察是确定样本含量的一个重要原则,其结果是导致人力、物力和时间的浪费。由于过分追求数量,可能引入更多的混杂因素,对研究结果造成不良影响;另一种是在科研设计中,忽视保证足够样本含量的重要性,使得样本含量偏少,检验效能(PoW
5、er=1P,若对比组的参数之间在总体上确实存在差异,假设检验能够发现这种差别的能力被称为检验效能或把握度)偏低,导致总体中本来存在的差异未能检测出来,出现了非真实的阴性结果,这是当前医学研究中值得注意的问题。事实上,在一个科研项目中,所需样本含量的大小与许多因素有关,涉及到统计研究设计的类型(调查设计、实验设计和临床试验设计),对结果精确度要求的高低和研究进度的快慢以及资料的性质和研究目的,应借助适当的公式,对样本含量进行估计。研究者可以根据需要和可能来确定一个适当的样本含量。另一方面,当医务工作者阅读专业文献时,对于那些假设检验的阴性结果(P0.05),有必要复核样本含量的检验效能是否偏低,
6、以便正确分析假设检验的结论。各种实验设计条件下样本含量的估计是一个比较复杂的问题,国内外统计工作者已作了大量卓有成效的探索和研究,提出了不同条件下样本含量的估计方法和估计公式。本章对他们的研究成果做了一个扼要的介绍,以便读者在科研工作中估计样本含量时参考。17.2 确定样本含量时应具备的条件在进行统计学的教学、咨询和培训工作中,人们经常询问的一个问题就是:我希望说明一下新的治疗方案优于旧的治疗方案,请你告诉我该选用多少名患者?这个问题常使统计学工作者无言以对,因为要想确定一个研究项目所需要的样本含量,凭空想象是没有科学依据的,必须提供一些起码的前提条件,才能做出有理有据的估算。例如,在实验设计
7、中,若观测的结果变量是定量资料,且拟对定量指标的平均值进行假设检验时,常需提供的前提条件有如下几项内容:1 .定出检验水准,即事先规定本次试验允许犯I型(或假阳性)错误的概率,通常规定=0.05;同时还应明确是单侧检验还是双侧检验,定得越小,所需的样本含量越大。2 .提出所期望的检验效能(或称把握度)1一。(这里为允许犯11型(或假阴性)错误的概率),即在特定的水准下,若总体参数之间确实存在着差别,此时该次试验能发现此差别的概率,要求的检验效能越高,所需的样本含量就越大。实际上,检验效能由犯H型错误的概率的大小所决定。在科研设计时,检验效能不宜低于0.75;否则,检验的结果很可能反映不出总体参
8、数的真实差别,出现非真实的阴性结果。3 .必须知道由样本推断总体的一些信息。比较两个总体均数或概率的差别时,应当知道总体参数间的差值3的信息。如两个总体均数间的差值5=川一U2的信息,两个总体概率间的差值3=加一兀2的信息。有时研究者很难得到总体参数的信息,可以用专业上(临床上)认为有意义的差值代替,如平均舒张压的差值K).69kPa(5mmHg),白细胞的平均差值为0.5xl()9L(500个mm2)等;也有人主张用0.25倍或0.50倍的标准差估计总体均数间的差值。当然,也可以根据试验的目的人为规定,如规定试验的新药有效概率必须超过标准药物有效概率的30%才有推广价值等。此外,确定两个均数
9、比较时的样本含量还需要有总体标准差。的信息。这些信息也可以通过查阅资料,借鉴前人的经验或进行预试验寻找参考值。17.3 检验效能的计算前面已经提到,检验效能是由H型错误概率的大小所决定的,即POWer=当假设检验出现“阴性”结果(P0.05)时,有必要复核样本含量和检验效能是否偏低,以便正确分析假设检验阴性结论的正确性。当假设检验为“阴性”结论时(P0.05)时,可在一定的假设下利用公式计算U20值,然后查标准正态分布曲线下的面积表来确定值,进而得出检验效能(l-)o若检验效能偏低,则说明试验的样本含量不够,应进一步予以增大。17.3.1 两组例数相等的样本频率比较时检验效能的计算用公式(17
10、-3-1)计算耶值:(17-3-1)式中,N为两组的合计例数;l与2分别为两组的总体概率,可用两组的样本概率pi与P2作为估计值;兀为两总体合并的概率,可用两组的样本频率Pl与P2的平均值P作为估计值,即P=(p+p2)2;Ua为对应于的标准化正态离差值,可查表计算出s0值后,可查表或借助统计软件获得对应于U2B左尾面积的值。表1734几种常见的U界值(X或BUa(双侧)U2(单侧)u20.200-1.282-0.842-0.8420.150-1.440-1.036-1.0360.100-1.645-1.282-1.2820.050-1.960-1.645-1.6450.025-2.240-1
11、.960-1.9600.010-2.576-2.326-2.326例现有某国产抗菌新药需进行临床试验,用同类进口药作对照,选取患有某种疾病并符合入选条件的患者60例,随机分为两组,每组30人。试验结果见表17-32。表1732两组患者用药后有效频率分析分组例数有效频率()P试验组3070.00.05对照组3090.0两组患者有效频率分别为70.0%和90.0%,经2检验无统计学意义(P0.05),此时需考虑到是否由于两组试验患者例数不足,致使检验效能偏低,造成假的“阴性”结果。现计算其检验效能。由于N=60,p=0.700,p2=0.900=(p1+p2)2=(0.700+0.900)2=0.
12、800,取=0.05,则uo.o5=1.960(双侧),代入式(17-3-1)得:按U20=O.O24计算得:=0.509,则POWer=1一口=1-0.509=0.4910.0584.4两组患者有效频率分别为70.0%和84.4%,经2检验无统计学意义(P0.05).试计算其检验效能。本例n=50,n2=45,p=0.700,p2=0.844,p=(500.700+450.844)(50+45)=0.768,取=0.05,uo.o5=-1.960(双侧)。代入式(17-3-2)得:按U2p=0.31查表得:=0.6217,贝UPoWer=1-=10.6217=0.3783v0.75,检验效能
13、很低,需增加样本含量进一步扩大临床试验。17.3.3 配对或交叉设计资料假设检验时检验效能的计算用公式(17-3-3)计算U2p值:(17-3-3)式中,Od为配对资料总体差值的标准差,可用样本的Sd作为估计值;为观察例数,6、U20意义同前。例17-3-3研究某升白药对白细胞减少症的“升白”效果,经对30例白细胞减少症患者的临床试验,结果为用药后白细胞平均升高=700个mn,标准差Sd=2000个m经配对资料的假设检验无统计学意义(P005)试计算其检验效能。本例3=700个mm3,N=30,Od=2000个mm3,取=0.05,uo.o5=1.960(双侧)。代入式(17-3-3)得:按U20.04,查表得:=0.5160,则power=1-=0.48400.05对照组301.200.83本例I=L50,2=1.20,=0.30,n=30,m=30,=0.83,取=0.0