《描述定量资料的集中趋势与离散程度的指标的使用条件.docx》由会员分享,可在线阅读,更多相关《描述定量资料的集中趋势与离散程度的指标的使用条件.docx(4页珍藏版)》请在优知文库上搜索。
1、统计研究的步骤设计、收集、整理、分析。描述定量资料的集中趋势与离散程度的指标的使用条件集中趋1)算数均数(口,又):适用于单峰对称分布资料。2)几何均数(G):适合于作对数变换后单峰对称分布资料(等比资料、滴度资料、对数正态分布资料)。3)中位数(M)和百分位数(PX):适用于任何分布的资料;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平(偏态分布、分布不明资料、有不确定值的资料)。4)不同质的资料应考虑分别计算平均数。离散程度:1)极差(R)不稳定,
2、不灵敏。2)标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。3)变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并取消了单位。因此变异系数常用于:比较度量衡单位不同的两组或多组资料的变异度;比较均数相差悬殊的两组或多组资料的变异度。平均数与变异度的关系1)均数标准差(min,max)2)中位数四分位数间距(min,max)3)变异度小,则均数代表性好。4)变异度大
3、,数据分散,则均数代表性差。5)平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征。正态分布的特征1)单峰分布;高峰在均数处。2)以均数为中心,均数两侧完全对称。3)正态分布有两个参数(Parameter),即位置参数(均数)和变异度参数(标准差)。4)有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。5)正态曲线下的面积分布有一定的规律。正态曲线下的面积规律1)正态曲线下面积总和为1。2)正态曲线关于均数对称;对称的区域内面积相等。3)对任意正态曲线,按标准差为单位,对应的面积相等。参考值范围的确定原则和方法原则:1)选定足够例数的同质的正常人作为研究对
4、象2)控制检测误差3)判断是否分组(性别,年龄组)4)单、双侧问题5)选择百分界值(90%,95%)6)确定可疑范围方法:正态分布法、百分位数法均数的抽样误差的规律性在样本含量足够大时:无论总体分布如何,其均数的分布趋于正态分布(大数定律)在样本含量较小时:总体为正态分布时:正态分布总体为非正态分布时:?简述标准差和标准误的区别和联系标准差与标准误的联系:1 .都是变异指标。2 .当n不变时,标准差3标准误f标准差与标准误的区别:1 .标准差描述原始数据的离散程度;标准误反映均数的抽样误差大小。2 .标准差衡量样本均数对原始数据的代表性,标准差越小,样本均数对原始数据的代表性越好;标准误衡量样
5、本均数估计总体均数的精确性,标准误越小,样本均数估计总体均数精度越高。3 .当n-*N时,样本标准差一总体标准差;当n-*N时,标准误一0。4 .结合样本均数和正态分布的规律,标准差估计参考值范围;结合样本均数和t分布的规律,标准误估计总体均数的可信区间。简述参考值范围与均数的可信区间的区别和联系1 .可信区间用于估计总体参数,总体参数只有一个。2 .参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。3 .95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95%;95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。假设检验的基本思想、
6、原理及步骤基本思想:反证法提出一个假设(H0);如果假设成立,会得到现在的结果吗?1 .得到现在的结果可能性很小(小概率):拒绝HO2 .有可能得到现在的结果(不是小概率):没有理由拒绝HO步骤:1 .建立检验假设2 .确定检验水准3 .计算检验统计量,界定P值4 .推断性结论1)当PWa时,拒绝HO,接受Hl,差别有统计学意义。2)当P时,不拒绝H0,差别尚无统计学意义。P值的意义,口的意义P值的意义:1 .从HO总体中随机获得等于或大于现有统计量值的概率。2 .拒绝HO时所冒的风险。P值的大小标明以多大的误差拒绝HO。P值越小,说明越有理由拒绝HO而接受Hl,越有理由说明样本所分别来自的总
7、体有差别。a的意义:1 .I型错误的概率。2 .根据研究者的要求在计算检验统计量之前设定的。3 .确定=0.05,即I型错误的概率为0.05,理论上100次抽样中发生这样的错误平均有5次。区间估计与假设检验的联系方差分析的基本思想组内变异:抽样误差组间变异:组间本质差别+抽样误差如果组间无木质差别,则组间变异=组内变异或:MS组间/MS组内=1常用相对数的指标有哪些?它们的意义和计算上有何不同?标准化的意义是什么?2检验的应用条件1.四格表的分析方法选择条件:1) n40,T5,用2;2) n40,但140;2) 20vb+cW40用校正2。3) b+c20,二项分布直接计算概率。3. RXC
8、表的分析方法选择条件:1)理论数不能小于等于1;2)理论数大于1小于等于5的格子数不超过总格子数的1/5。3)否则用FiSher确切概率;4) 或似然比检验(IikelihOodratiotest)4.如果以上条件不能满足,可采用:1)增加样本含量2)删去某行或某列3)合理地合并部分行或列4) FiSher精确概率法非参数统计的概念、优缺点、适用条件ppt54直线相关与回归的区别及联系相关与回归分析的正确应用实验设计的基本要素、基本原则1 .基本要素:处理、对象、效应2 .基本原则:对照:均衡性(1)对等除处理因素外,对照组具备与实验组对等的非处理因素。(2)同步对照组与实验组设立之后,在整个
9、研究进程中始终处于同一空间和同一时间。(3)专设任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往的结果或其它研究的资料作为本研究之对照。随机:客观性(1)抽样随机每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到样本中来;(2)分组随机每个实验对象分配到不同处理组的机会相同;(3)实验顺序随机每个实验对象接受处理先后的机会相同。重复:可靠性(1)整个实验的重复。确保实验的重现性,以提高实验的可靠性;(2)用多个实验单位进行重复(样本含量)。避免把个别情况误认为普遍情况,把偶然性或巧合的现象当作必然的规律,通过一定数量的重复,使结论可信;(3)同一实验单位的重复观察。保证观察结果的精度。