《第8讲相关分析和回归分析.ppt》由会员分享,可在线阅读,更多相关《第8讲相关分析和回归分析.ppt(13页珍藏版)》请在优知文库上搜索。
1、一、相关分析一、相关分析二、回归分析二、回归分析相关系数示意图相关系数示意图 散点呈椭圆形分布,散点呈椭圆形分布,X X、Y Y 同时同时增减增减-正正相关相关(positive correlation)positive correlation);X X、Y Y 此增彼减此增彼减-负负相关相关(negative correlation)(negative correlation)。散点在一条直线上,散点在一条直线上,X X、Y Y 变化趋势变化趋势相同相同-完完全正相关全正相关;反向反向变化变化-完全负相关。完全负相关。相关系数示意图相关系数示意图 X X、Y Y 变化互不影响变化互不影响-零
2、零相关相关(zero correlation)(zero correlation)相关系数相关系数(correlation coefficient),对于正态分布,对于正态分布资料资料,选择积差相关系数选择积差相关系数,又称又称 Pearson Pearson 相关系数相关系数.对于非正态分布资料对于非正态分布资料,选择等级相关系数选择等级相关系数(Spearman(Spearman或或KendallKendall相关系数相关系数).).Pearson相关系数计算公式相关系数计算公式:YYXXXYlllYYXXYYXXr22【例例1】相关分析相关分析.sav 分析年龄和片段长度的相关性分析年龄
3、和片段长度的相关性相关性相关性1-.732*.000123123-.732*1.000123123Pearson 相关性显著性(双侧)NPearson 相关性显著性(双侧)N年龄(岁)限制性端粒片断长度(bp)年龄(岁)限制性端粒片断长度(bp)在.01 水平(双侧)上显著相关。*.结论结论:两变量存在显著的负相关两变量存在显著的负相关 回归分析回归分析(Regression)是一种应用极为广泛的数量是一种应用极为广泛的数量分析方法。它用于考察一个变量分析方法。它用于考察一个变量(因变量因变量)与其余变量与其余变量(自变量自变量)之间的数量关系,并通过回归方程的形式反之间的数量关系,并通过回归
4、方程的形式反映这种关系映这种关系,进而为控制和预测提供科学依据。进而为控制和预测提供科学依据。一元线性回归一元线性回归(linear regression):自变量只有一个自变量只有一个.多元线性回归多元线性回归(multiple linear regression):自变量自变量有多个有多个.(1)确定回归方程中的自变量和因变量;)确定回归方程中的自变量和因变量;(2)确定回归方程形式;)确定回归方程形式;(3)建立回归方程,估计参数;)建立回归方程,估计参数;(4)对回归方程进行各种统计检验;)对回归方程进行各种统计检验;(5)利用回归方程进行预测。)利用回归方程进行预测。l 01 yx一
5、元线性回归方程模型一元线性回归方程模型01 122kkyxxx多元线性回归方程模型多元线性回归方程模型2012yxx01xye可化为线性回归的方程模型可化为线性回归的方程模型1.回归方程的拟合优度检验回归方程的拟合优度检验 决定系数决定系数R2越接近于越接近于1,说明回归方程对样本数据点,说明回归方程对样本数据点拟和得越好拟和得越好.2.回归方程的显著性检验回归方程的显著性检验 检验统计量检验统计量F值越大,则值越大,则P值越小值越小,说明回归方程越显著说明回归方程越显著.3.回归系数的显著性检验回归系数的显著性检验 回归系数对应的检验统计量回归系数对应的检验统计量t的绝对值越大,则相应的绝对
6、值越大,则相应的的P值越小值越小,说明回归系数越显著说明回归系数越显著.特别地特别地,在显著时回归系在显著时回归系数的置信区间不包含数的置信区间不包含0.l 【例例2】回归分析回归分析1.sav 上海医科大学儿科医院研上海医科大学儿科医院研究某种代乳粉的营养价值是用大白鼠做试验,得大白究某种代乳粉的营养价值是用大白鼠做试验,得大白鼠进食量(鼠进食量(g)和体重增量()和体重增量(g)间关系的原始数据。)间关系的原始数据。试对进食量和体重增量进行回归分析。试对进食量和体重增量进行回归分析。体重增量体重增量-17.3570.222进食量进食量l 如果将一些回归效果不显著的自变量引入方程如果将一些回
7、归效果不显著的自变量引入方程,会降会降低模型的精度低模型的精度,因此需要将其从方程中剔除因此需要将其从方程中剔除,同时应尽可能同时应尽可能将回归效果显著的自变量放入方程中将回归效果显著的自变量放入方程中;在需要时在需要时,还可以还可以添加交叉项添加交叉项(考虑交互效应考虑交互效应)和平方项和平方项(二次函数二次函数)以进一步以进一步提高模型的精度和实用性提高模型的精度和实用性.哪个模型的调整决定系数哪个模型的调整决定系数RC2大大,哪个模型就优哪个模型就优.逐步回归法逐步回归法:methodstepwise,选用不同的组选用不同的组合进行筛选合进行筛选.【例例3】回归分析回归分析2.sav 牙膏的销售量牙膏的销售量 最佳结果最佳结果:y=29.1133+11.1342x1-7.6.80 x2+0.6712x22-1.4777x1x2R2=0.9209