《最小二乘法在误差分析报告中地应用.docx》由会员分享,可在线阅读,更多相关《最小二乘法在误差分析报告中地应用.docx(12页珍藏版)》请在优知文库上搜索。
1、误差理论综述与最小二乘法讨论摘要:本文对误差理论和IT关数据处理的方法进行综述。并且针对最小二乘法15)的创立、发展、思想方法等相关方面进行了研究和总结。同时,将近年发展起来的全面最小二乘法(TLS)同传统最小二乘法进行了对比.1 .误差的有关概念对科学而言,各种物理量都需要经过测量才能得出结果。许多物理量的发现,物理常数的确定,都是通过精密测量得到的。任何测试结果,都含有误差,因此,必须研究,估计和判断测量结果是否可靠,给出正确评定。对测量结果的分析、研究、判断,必须采用误差理论,它是我们客观分析的有力工具1.1 测量基本概念一个物理量的测量值应由数值和单位两部分组成。按实验数据处理的方式,
2、测量可分为直接测量、间接测量和组合测量。直接测发:可以用测限仪表直接读出测量值的测质.间接测量:有些物理量无法直接测得,需要依据待测物理量与若干直接测量量的函数关系求出。组合测量:如有若干个待求量,把这些待求量用不同方法组合起来进行测量,并把测量结果与待求量之间的函数关系列成方程组,用最小二乘法求出这个待求量的数值,即为组合测量。1.2 误差基本概念误差是评定测成精度的尺度,误差越小表示精度越高。若某物理成的测量值为丫,真值为Y,则测量误差dy=Y-丫。虽然真值是客观存在的,但实际应用时它一般无从得知。按照误差的性质,可分为随机误差,系统误差和粗大误差三类。随机误差:是同测发条件下,重复测量中
3、以不可预知方式变化的测后误差分应。系统误差:是同一测量条件下,重且测量中保持恒定或以可预知方式变化的测量误差分量。粗大误差:指超出在规定条件下预期的误差。1.3 等精度测量的随机误差当对同一量值进行多次等精度的重更测量,得到一系列的测量值,每个测量值都含有误差,这些误差的出现没有特定的规律,但就误差的总体而言,却rr统计规律.1. 3.1正态分布通过对大量的测房数据的观察,人们发现测量列的随机误差布以下几个特征:(1) 绝对值相等的正误差与负误差出现的次数相等,即误差的对称性;(2) 绝对值小的误差比绝对值大的误差出现的次数多,即误差的单峰性:3)在一定的测量条件下,随机误差的绝对值不会超过一
4、定界限,即误差的Tr界性:(4)随着测量次数的增加,随机误差的算术平均值趋于零,即误差的抵偿性。正态分布曲线如下图1-1所示。正态分布时区间(。,+)的面积占总面积的68.27%;(T.96.,+1.96。)的面积占总面积的95%;区间(”一2.580,“+2.580)的面积占总面积的99%。图I-L正态分布曲线1.1 .2t分布t分布是小样本分布,小样本分布一般是指n3.,该数据为异常数据,应剔除。莱依特准则的合理性是显然的,对服从正态分布的随机误差,其残差落在(-3a,3。)以外的概率仅为0.27%,当在有限次测量中发生的可能性很小,认为是不可能发生的。(2)肖维勒准则:若对某一物理量等精
5、度重熨测量n次,得测量值%1,%2%3%“若认为j为可疑数据,若此数据的残差IY2.,则此数据为异常数,应剔除。实用中Z3,这在一定程度上弥补了3。准则的不足。Z是与测量次数n有关的系数。其关系见表1-2。n34567891011Z1.381.531.641.731.801.861.921.962.00n121314151617181920Z2.032.072.102.132.152.172.202.222.24表-2(3) t检验准则(罗曼诺夫斯基准则):罗曼诺夫斯基准则又称t检验准则,其特点是首先剔除一个可疑的测得值,然后按t分布检验被剔除的测量值是否为异常值.(4)格罗布斯准则。(5)狄
6、克逊准则。2 .测量的不确定度测量数据或经数据处理给出的最终结果都不可能是客观真值,只是被测量的近似值(或估计量)。因此,只给出被测量的估计值是不够的,还必须对估计值做出精度估计。测成或结果的精度估计用“不确定度”这参数表征。它表征被测量的真值所处的量值散布范围的评定,反映了由于误差存在而对被测量值不能确定的程度。测量不确定度涉及到测量误差的性质、分布及测量方法等。不确定度的表述是数据处理的基本要求.2.1 不确定度的定义与分类测适不确定度是指测量结果的不肯定,是表征被测量的真值在某个适值范围的个估计,是测量结果含Yf的个参数,用以表示被测量值的分散性。这种测量不确定度的定义表明,一个完整的测
7、量结果应包含被测量值的估计与分散性参数两个部分。如被测量Y的测量结果为y1;其中y是被测量的估计,它具有的测量不确定度为U。不确定度从评定方法上可分为两类:A类分量和B类分量。用统计分析法来评定的不确定度称为A类不确定度评定,行测量误差服从正态分布时,以标准差表示称为标准不确定度,用符号U表示.U二不能由统计分析法评定的不确定度称为B类不确定度评定,A类以外的不确定度均属于B类不确定度。测室误差和测量不确定度是误差理论中两个重要的概念,它们具有相同点,都是评价测量结果质量好坏的重要指标,但它们又有明显的区别。2.2 提高测量精度的途径在拟定或设计测届方法时,需要确定测量的不确定度。测量的总不确
8、定度应根据被测量的精度要求恰当的给以规定。反过来,要想提高测量的精度,就应尽可能的减小最后结果的总不确定度。根据不确定度的合成关系,可从下面几方面着手。(1) 控制测量的误差因素:(2) 选择有利的测量方案;L当等精度测成时,测量数据与直接测质量.的域佳估值L的残,差应满足最小,即:后二(7.-y.)2=min1iiI-/三y3.4 回归分析回归分析(RegreSSiOnAnaIySiS)是英国生物学家兼统计学家高尔顿(GaIton)在1889年出版的自然遗传一书中首先提出,是处理变量之间相关关系的一种数理统计方法。由于相关变量之间不存在确定性关系,因此,在生产实践和科学实验所记录的这些变星的
9、数据中,存在不同程度的差异。回归分析就是应用数学方法,对大员观测数据进行处理,从而得到比较符合事物内部规律的数学表达式。4 .最小二乘法的创立、发展及其思想最小:乘法是提供“观测组合”的主要工具之一,它依据对某事件的大量观测而获得“最佳”结果或“最可能”表现形式.如已知两变量为线性美系y=a+bx,对其进行n(n2)次观测而获得n对数据.若将这n对数据代入方程求解a,b之值则无确定解。最小二乘法提供了一个求解方法,其基本思想就是寻找“最接近”这n个观测点的直线。最小二乘法不仅是19世纪最重要的统计方法,而且还可以称为数理统计学之灵魂。相关回归分析、方差分析和线性模型理论等数理统计学的几大分支都
10、以最小二乘法为理论基础。作为其进一步发展或纠正其不足而采取的对策,不少近现代的数理统计学分支也是在最小二乘法基础上衍生出来的。正如美国统计学家斯蒂格勒(S.M.Stigler)所说,“最小二乘法之于数理统计学犹如微积分之于数学“.天文学和测地学的发展促进了数理统计学及其他相关科学的发展。丹麦统计史家哈尔德曾指出天文学在数理统计学发展中所起的作用。”天文学自古代至18世纪是应用数学中最发达的领域。观测和数学天文学给出了建立数学模型及数据拟合的最初例子,在此种意义下,天文学家就是最初的数理统计学家。天文学的问题逐渐引导到算术平均,以及参数模型中的种种估计方法,以最小二乘法为顶峰。”这也说明了最小二乘法的显著地位。4.1 勒让德创立最小二乘法现行的最小二乘法是勒让德(A.M.Legendre)于1805年在其著作计算彗星轨道的新方法中提出的,该书有80页,包含8页附录,最小乘法就包含在这个附录中。勒止镌之所以能做出这个发现,是因为他没有