《统计学非线性回归.ppt》由会员分享,可在线阅读,更多相关《统计学非线性回归.ppt(24页珍藏版)》请在优知文库上搜索。
1、 医学研究中医学研究中X X和和Y Y的数量关系常常不是的数量关系常常不是线性的,如毒物剂量与动物死亡率,人的线性的,如毒物剂量与动物死亡率,人的生长曲线,药物动力学等,都不是线性的生长曲线,药物动力学等,都不是线性的。如果用线性描述将丢失大量信息,甚至。如果用线性描述将丢失大量信息,甚至得出错误结论。这时可以用得出错误结论。这时可以用曲线直线化估曲线直线化估计计(Curve estimationCurve estimation)或)或非线性回归非线性回归(Nonlinear regression) (Nonlinear regression) 方法分析,也方法分析,也称曲线拟合称曲线拟合(C
2、urve(Curve fitting)。 绘制散点图,根据图形和专业知识选取曲线类绘制散点图,根据图形和专业知识选取曲线类型(可同时选取几类)型(可同时选取几类)按曲线类型,作曲线直线化变换按曲线类型,作曲线直线化变换建立直线化的直线回归方程;作假设检验,计建立直线化的直线回归方程;作假设检验,计算决定系数算决定系数将变量还原,写出用原变量表达的曲线方程将变量还原,写出用原变量表达的曲线方程比较决定系数选取比较决定系数选取“最佳最佳”曲线方程曲线方程 常见的曲线回归方程 对数:)ln(XbaY幂函数:baXeY 或 )ln()ln(XbaY指数函数:bXaeYbXaY)ln(多项式:nnXbX
3、bXbaY221 )1/(1bXaeY 或 logistic:bXaYY)1/(ln 或 例例 上海医科大学微生物学教研室以已知浓度上海医科大学微生物学教研室以已知浓度X的免的免疫球蛋白疫球蛋白A(IgA, g/ml)作火箭电泳作火箭电泳, 测得火箭高度测得火箭高度Y(mm)如表如表1所示。试拟合所示。试拟合Y关于关于X的非线性回归方程。的非线性回归方程。Y(lnX)2 Y2 (lnX)Y 残差平方残差平方2.5902 57.76 -12.2314 2.5902 57.76 -12.2314 0.8396 151.29 -11.2705 0.8396 151.29 -11.2705 0.260
4、9 246.49 -8.0196 0.2609 246.49 -8.0196 0.0498 331.24 -4.0604 0.0498 331.24 -4.0604 0.0000 349.69 0.0000 0.0000 349.69 0.0000 0.0332 457.96 3.9012 0.0332 457.96 3.9012 0.1132 510.76 7.6049 0.1132 510.76 7.6049 0.2209 566.44 11.1860 0.2209 566.44 11.1860 4.10784.1078 2671.632671.63 -12.8898-12.8898 7.
5、23 12.62 15.77 18.01 19.75 21.16 22.36 23.40 0.1380 0.1017 0.0053 0.0361 1.0921 0.0563 0.0566 0.1597 1.6458 =a+blnX Y Y回归方程为:回归方程为: =19.7451+7.7771 lnX=19.7451+7.7771 lnX方差分析有统计学意义,方差分析有统计学意义,P P0.00000.0000,F F763.50763.50,表明回归方程有贡献。,表明回归方程有贡献。确定系数为确定系数为0.990.99,表明回归拟合原资,表明回归拟合原资料很好。料很好。Y表表9- 25名重伤
6、病人的住院天数名重伤病人的住院天数X与预后指数与预后指数Y0102030405060020406080住院天数X预后指数Y012345020406080住院天数(天)X预后指数的对数lnY Yln回归方程为:回归方程为: 4.037-0.0384.037-0.038X X方差分析有统计学意义,方差分析有统计学意义,P P0.00000.0000,F F276.38276.38,表明回归方程有贡献。,表明回归方程有贡献。确定系数为确定系数为0.95510.9551,表明回归拟合原,表明回归拟合原资料较好。资料较好。转换为原方程的另一种形式:转换为原方程的另一种形式: XXeeY038. 0)03
7、8. 0037. 4(665.56XXeYeY0396. 0038. 06066.58;665.56XXeYeY0396. 0038. 06066.58;665.56比较两个回归方程可见,对同一份样本比较两个回归方程可见,对同一份样本采用不同估计方法得到的结果并不相同。采用不同估计方法得到的结果并不相同。主要因为曲线直线化以后的回归只对变主要因为曲线直线化以后的回归只对变换后的换后的Y Y* *( (lnY)lnY)负责负责, , 得到的线性方程可得到的线性方程可使使Y Y* *与其估计值与其估计值 之间的残差平方和最小之间的残差平方和最小, ,并不保证原变量并不保证原变量Y Y与其估计值与其
8、估计值 之间的残之间的残差平方和也是最小。差平方和也是最小。YY曲线直线化曲线直线化 非线性最小二乘法非线性最小二乘法Y)ln()ln(XbaY问题问题:前一个例子只对自变量作对:前一个例子只对自变量作对数变换的数变换的,能否保证原,能否保证原变量变量Y Y与其估计值与其估计值 之间的残差平方之间的残差平方和也是最小?和也是最小?)ln(XbaY问题问题:如何判断哪个曲线拟合方程更佳?:如何判断哪个曲线拟合方程更佳? 对于例,几个常见曲线拟合得到的决定对于例,几个常见曲线拟合得到的决定系数系数R R2 2如下(如下(曲线直线化曲线直线化):):R R2 2R2R R2 2R R2 2 R R2
9、 2问题问题:如何判断那个曲线拟合方程更佳?:如何判断那个曲线拟合方程更佳? 对于例,几个常见曲线拟合得到的决定对于例,几个常见曲线拟合得到的决定系数系数R R2 2如下(如下(非线性回归非线性回归迭代法迭代法):):R R2 2R2R R2 2R R2 2 R R2 2 原变量原变量Y Y与与 (直线或曲线方程得到)间(直线或曲线方程得到)间相关系数的绝对值相关指数相关系数的绝对值相关指数R RR RRR RR R R RR R的计算的计算(曲线直线化)(曲线直线化) Y 原变量原变量Y Y与与 (直线或曲线方程得到)间(直线或曲线方程得到)间相关系数的绝对值相关指数相关系数的绝对值相关指数
10、R RR RRR RR R R RR R的计算的计算(非线性回归)(非线性回归) Y散点图辨析散点图辨析 0102030405060010203040506070病人住院天数X预后指数Y对数曲线指数曲线 如果条件允许最好采用非线性回如果条件允许最好采用非线性回归(归(Nonlinear Regression)拟合幂)拟合幂函数曲线与指数函数曲线函数曲线与指数函数曲线 注意绘制散点图,并结合专业知注意绘制散点图,并结合专业知识解释识解释采用采用SASSAS进行曲线拟合进行曲线拟合采用采用SPSSSPSS进行曲线拟合进行曲线拟合曲线直线化Analyze Regression Curve Estimation 可选Power 、Logarithmic、Exponential、Quadratic、Cubic 等 非线性回归Analyze Regression Nonlinear 设置模型: Model Expression 参数赋初值:Parameters