《《医学统计学》之医学统计学绪论.ppt》由会员分享,可在线阅读,更多相关《《医学统计学》之医学统计学绪论.ppt(38页珍藏版)》请在优知文库上搜索。
1、 第一节第一节 统计学与医学统计学方法统计学与医学统计学方法 统计学统计学是是收集收集、分析分析、解释解释与与呈现呈现数据数据资料的一门科学。资料的一门科学。StatisticsStatistics:“a science dealing with the collection,analysis,interpretation and presentation of masses of numerical data”-Webster 国际大辞典国际大辞典收集数据收集数据:实验设计、调查设计实验设计、调查设计(8,9)分析数据分析数据:统计学描述统计学描述(2)、统计学推断、统计学推断(37;10)
2、解释数据解释数据:根据专业等解释统计结果根据专业等解释统计结果(穿穿插各个章节插各个章节)呈现结果呈现结果:向杂志社、上级部门发表结向杂志社、上级部门发表结果果(12)统计工作的统计工作的基本基本步骤步骤 1.统计设计统计设计:包括调查、实验设计。:包括调查、实验设计。2.收集资料收集资料:取得准确可靠的原始资料:取得准确可靠的原始资料3.整理资料整理资料:对资料进行清理、改错,数量:对资料进行清理、改错,数量化化4.分析资料分析资料:统计描述、统计推断:统计描述、统计推断医学统计学医学统计学用统计学原理和方法研究医学问题用统计学原理和方法研究医学问题第二节第二节 数据类型数据类型1.计量资料
3、计量资料2.计数资料计数资料3.等级资料等级资料4.三类资料间关系三类资料间关系住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月2022
4、4662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitati
5、ve data Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料Units;elements1.计量资料计量资料 用仪器、工具等用仪器、工具等测量测量(measure)方法获得方法获得的数据,即为的数据,即为计量资料计量资料measurment data。也。也叫定量数据叫定量数据Quantitative data特点:特点:有计量单位有计量单位,如患者的身高(,如患者的身高(cm)、)、体重(体重(kg)、血压()、血压(mmHg)、脉搏(次)、脉搏(次/分分)、红细胞计数()、红细胞计数(10/L)2.
6、计数资料计数资料 按某种属性分类,然后清点每类的数按某种属性分类,然后清点每类的数据,称据,称计数资料计数资料(count datacount data)或)或enumeration dataenumeration data。也叫定性数据。也叫定性数据Qualitative dataQualitative data 特点:特点:无固有计量单位无固有计量单位,如肤色(黑、,如肤色(黑、白)、血型(白)、血型(ABO)、职业(工农兵)、性)、职业(工农兵)、性别(男女)别(男女)3.3.等级资料等级资料 Rank dataRank data 半定性或半定量的观察结果。有大小顺半定性或半定量的观察结
7、果。有大小顺序,所以也叫序,所以也叫有序分类资料有序分类资料(ordinal category data)。)。癌症分期:早、中、晚。癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死药物疗效:治愈、好转、无效、死亡。亡。尿蛋白:尿蛋白:,+,+及以上及以上实例数据实例数据1实例数据实例数据24.4.三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 171
8、7 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料第三节第三节 统计学基本概念统计学基本概念 1.1.随机变量及其分类随机变量及其分类2.2.同质与变异同质与变异3.3.总体与样本总体与样本4.4.参数与统计量参数与统计量5.5.误差误差6.6.概率概率1.随机变量随机变量(random variable)简称变量变量(variable),统计上习惯用大写拉丁字母表示,如X、Y、Z、。变量值变量值习惯习惯用小写拉丁字母表示,如性别x11(男)、x2 1(男)、x3 0(女)、。编号编号(ID)性别性别(X)体重体重 (kg)(Y)疗效疗效(Z)张张11660李李21781
9、王王30572 随机变量的分类随机变量的分类 离散型变量离散型变量(discrete variable),相当于计数),相当于计数资料资料 连续性变量连续性变量(continuous variable),相当于),相当于计量资料计量资料 有序变量有序变量(ordinal variable),相当于等级资),相当于等级资料料2.同质与变异同质与变异 homogeneity and variation s同质:指事物的性质、影响条件或背景同质:指事物的性质、影响条件或背景相同或非常相近。相同或非常相近。s变异变异:指同质的个体之间的差异:指同质的个体之间的差异。同质与变异的例子同质与变异的例子s例
10、例1 调查调查2003年西安市年西安市7岁男童的身岁男童的身高和体重高和体重同质同质:2003年、西安市、年、西安市、7岁男童岁男童变异变异:身高和体重各不相同:身高和体重各不相同s例例2 研究某降压药的疗效研究某降压药的疗效同质同质:高血压患者、用某药治疗:高血压患者、用某药治疗变异变异:疗效各不相同:疗效各不相同表表1-1 120名正常成年男子红细胞计数值名正常成年男子红细胞计数值(1012/L)5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64
11、 5.14 5.46 4.66 4.204.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68
12、 5.48 5.31 4.534.834.113.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69最大值=6.18,最小值=3.29,极差=2.89 算术均数=4.72,标准差=0.57 3.总体与样本总体与样本 population and sample总体总体:根据研究目的:根据研究目的确定的确定的同质同质研究对
13、象研究对象的的全体全体(集合)。分(集合)。分有限总体与无限总体有限总体与无限总体样本样本:从总体中随机:从总体中随机抽取的部分观察单位抽取的部分观察单位 随机抽样随机抽样 random sampling为了保证样本的为了保证样本的可可靠性靠性和和代表性代表性,需,需要采用随机的抽样要采用随机的抽样方法(在总体中每方法(在总体中每个个体具有个个体具有相同的相同的机会机会被抽到)。被抽到)。4.参数与统计量参数与统计量 parameter and statistic参数参数:总体总体的统计指标,的统计指标,如总体均数、标准差,采如总体均数、标准差,采用希腊字母分别记为用希腊字母分别记为、。固定的
14、常数固定的常数 样本样本抽取部分观察单位抽取部分观察单位 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记为 。参数附近波动的随机变量参数附近波动的随机变量。SX、5.误差误差 error误差误差:实际:实际观察值观察值与客观与客观真实值真实值之差之差(1)系统误差)系统误差(2)随机误差)随机误差(1 1)系统误差)系统误差 systematic error 在实际观测过程中,由受试对象、研究者、仪在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的器设备、研
15、究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为有一定倾向性或规律性的误差。流行病学称之为偏偏倚倚(bias)。)。特点:观察值有特点:观察值有系统性系统性、方向性方向性、周期性周期性的偏的偏离真值。离真值。可以通过严格的可以通过严格的实验设计实验设计和和技术措施技术措施消除消除。(2)随机误差随机误差random errorrandom error 排除上述误差后尚存的误差,受多种无法控制排除上述误差后尚存的误差,受多种无法控制的因素的影响。的因素的影响。特点:大小方向不一的随机变化。特点:大小方向不一的随机变化。随机测量误差随机测量误差(random measu
16、rement error)提高操作者熟练程度可以减少这种误差提高操作者熟练程度可以减少这种误差 随机抽样误差随机抽样误差(random sampling error):):由抽样造成的样本统计量和总体参数间的差异。由抽样造成的样本统计量和总体参数间的差异。不可避免,但有一定的分布规律,可估计。不可避免,但有一定的分布规律,可估计。6.概率概率probability 确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定不会会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果发生的现象。其表现结果为两种事件:肯定发生某种结果的叫的叫必然事件必然事件;肯定不发生某种结果的叫;肯定不发生某种结果的叫不可能事件不可能事件。随机现象随机现象:在同样条件下:在同样条件下可能可能会出现两种或多种结果,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为究竟会发生哪种结果,事先不能确定。其表现结果称为随随机事件机事件。随机事件的特征:随机事件的特征:随机性随机性;规律性规律性:每次发:每次发生的可能性的大小是确定的。生的可能性的大小是确定的。概率:概率