《统计学的意义.ppt》由会员分享,可在线阅读,更多相关《统计学的意义.ppt(32页珍藏版)》请在优知文库上搜索。
1、一、统计学的名词解释一、统计学的名词解释统计学统计学一词一词Statistics,源出于意大利文,源出于意大利文Stato,兼,兼有有“国家国家”和和“情况情况”的意义。的意义。统计学家统计学家一词一词Statistician,源出于意大利文,源出于意大利文Statista,意为,意为“处理国家事务的人处理国家事务的人”:a man who deals with affairs of the state所以,统计学可理解为所以,统计学可理解为“国务活动人员感兴趣的国务活动人员感兴趣的事实的汇集事实的汇集”: a collection of facts of interest to a stat
2、esman在早期,统计学就是国情学。这种说法流行于在早期,统计学就是国情学。这种说法流行于16世纪的意大利,后来传播到法、德、荷等欧世纪的意大利,后来传播到法、德、荷等欧陆国家。在陆国家。在17,18世纪,这些国家大学里教授世纪,这些国家大学里教授的的“统计学统计学”课程,实际上就是课程,实际上就是“国情学国情学”,包括有关人口,经济,地理,乃至政治方面的包括有关人口,经济,地理,乃至政治方面的内容。到十九世纪初,逐步演变为现代西方统内容。到十九世纪初,逐步演变为现代西方统计学计学Statistics。现代定义,现代定义,不列颠百科全书不列颠百科全书解释:解释: 统计学(统计学(Statist
3、ics)是收集和分析数据的)是收集和分析数据的科学与艺术。科学与艺术。 统计学是统计学是“科学科学”。 统计学是统计学是“艺术艺术”,指,指“艺术性艺术性”,说明统,说明统计学在理论、方法、应用中都要强调艺术性,时计学在理论、方法、应用中都要强调艺术性,时时具有灵活性,处处需要灵感。时具有灵活性,处处需要灵感。 统计学与数据打交道,必然离不开数学。关统计学与数据打交道,必然离不开数学。关于统计学的数学理论部分,在西方被称为于统计学的数学理论部分,在西方被称为Mathematical Statistics,是数学的一个分支,是数学的一个分支,是是Statistics的重要组成部分,但决不是全部。
4、的重要组成部分,但决不是全部。前苏联,把统计学定义为一门研究大量社会现象前苏联,把统计学定义为一门研究大量社会现象的社会科学,有很强的阶级性和党性;而数理统的社会科学,有很强的阶级性和党性;而数理统计学则被看作是在统计学中使用的数学方法及其计学则被看作是在统计学中使用的数学方法及其理论基础。受苏联影响,在我国至今仍有不少人理论基础。受苏联影响,在我国至今仍有不少人认为统计学是一门社会科学,数理统计学是一门认为统计学是一门社会科学,数理统计学是一门数学学科。随着时代的发展,在我国这个区别也数学学科。随着时代的发展,在我国这个区别也在渐渐消失。在渐渐消失。在国家技术监督局在国家技术监督局1992年
5、年11月颁布的月颁布的GB/T14745-92学科分类与代码学科分类与代码中,我国中,我国已经将已经将统计学与数学、经济学等学科并列为一统计学与数学、经济学等学科并列为一级学科级学科,把原属社会科学和自然科学领域的统,把原属社会科学和自然科学领域的统计学归并为一门统计学。统计学在我国已经开计学归并为一门统计学。统计学在我国已经开始向着一个新的方向发展,它研究始向着一个新的方向发展,它研究现代统计理现代统计理论、方法与计算问题,用统计学解决自然科学、论、方法与计算问题,用统计学解决自然科学、社会科学中的各种问题。社会科学中的各种问题。所以,统计学可分为所以,统计学可分为理论统计学与应用统计学理论
6、统计学与应用统计学两大类。二者相辅相两大类。二者相辅相成,不能分割。成,不能分割。 二、统计学的作用二、统计学的作用例一、许多统计学家在二战中发挥了重要作用,例一、许多统计学家在二战中发挥了重要作用,Wald是其中之一。他发明的一些统计方法在战是其中之一。他发明的一些统计方法在战时被视为军事机密。军方向他咨询:战机的哪些时被视为军事机密。军方向他咨询:战机的哪些部位需要加强?部位需要加强? 例二、强磁场会干扰活细胞,有人怀疑生例二、强磁场会干扰活细胞,有人怀疑生活在高压线附近的儿童,会有较多的人患上白活在高压线附近的儿童,会有较多的人患上白血病。怎么研究这个问题?我们不能把孩子暴血病。怎么研究
7、这个问题?我们不能把孩子暴露在高压线附近作实验,而比较暴露在高压线露在高压线附近作实验,而比较暴露在高压线附近时间较多和较少的儿童中患白血病的人数附近时间较多和较少的儿童中患白血病的人数也不太容易,因为患者本来就不会太多,而且也不太容易,因为患者本来就不会太多,而且患病原因其实很多,如食物,饮料,杀虫剂,患病原因其实很多,如食物,饮料,杀虫剂,等等。等等。 美国国家癌症研究所用美国国家癌症研究所用五年时间,花费五年时间,花费500万美元,收集有关数据,进行统计研究,万美元,收集有关数据,进行统计研究,最后做最后做出结论:在白血病和暴露在高压线产生的磁场之出结论:在白血病和暴露在高压线产生的磁场
8、之间没有相关关系。研究报告发表在间没有相关关系。研究报告发表在新英格兰医新英格兰医学期刊学期刊上。电视上还是报道有母亲抱怨自己的上。电视上还是报道有母亲抱怨自己的孩子得了白血病,而又正好住在高压线附近。我孩子得了白血病,而又正好住在高压线附近。我们知道,个案总是比研究报告更有说服力,但是们知道,个案总是比研究报告更有说服力,但是有一点统计知识的人应该知道,用数据得出的结有一点统计知识的人应该知道,用数据得出的结论比单一的轶闻更值得信赖,再没有必要为此事论比单一的轶闻更值得信赖,再没有必要为此事浪费时间和金钱做无谓的研究了。也许因该找找浪费时间和金钱做无谓的研究了。也许因该找找别的原因。别的原因
9、。例三、例三、2000年诺贝尔经济学奖获得者,年诺贝尔经济学奖获得者,James Heckman (1944),),Daniel McFadden(1937),),微观计量经济学家。奖励他们发展广泛应用于微观计量经济学家。奖励他们发展广泛应用于经济学及其其他社会科学中对个人和住户的行为经济学及其其他社会科学中对个人和住户的行为进行统计分析的理论和方法。例如,失业者再就进行统计分析的理论和方法。例如,失业者再就业的时间间隔问题,职业培训的价值问题(结论业的时间间隔问题,职业培训的价值问题(结论是:许多职业培训的作用被高估了!)是:许多职业培训的作用被高估了!) 1989,1990,1994,19
10、97,2002,2003等等年度的诺贝尔经济学奖获得者都是数学或统计学年度的诺贝尔经济学奖获得者都是数学或统计学出身。这让正统经济学院出身的经济学家多少有出身。这让正统经济学院出身的经济学家多少有点尴尬。当年诺贝尔不设数学奖,据说是心上人点尴尬。当年诺贝尔不设数学奖,据说是心上人被数学家抢跑了。现在的诺贝尔经济学奖几乎成被数学家抢跑了。现在的诺贝尔经济学奖几乎成了数学奖了。了数学奖了。 例四、统计学与金融工程例四、统计学与金融工程. 金融工程属于交叉性学科,包括以下金融工程属于交叉性学科,包括以下3个领域:个领域:(1)投资分析;投资分析;(2)风险管理;风险管理;(3)期货交易。其期货交易。
11、其中投资分析与风险管理两个领域直接涉及到统中投资分析与风险管理两个领域直接涉及到统计数据描述及统计推断,期货交易部分则与随计数据描述及统计推断,期货交易部分则与随机过程、随机微分方程的研究有关,有时被称机过程、随机微分方程的研究有关,有时被称为数理金融。为数理金融。例五、极值统计学例五、极值统计学 为抵御万年不遇的水灾,堤坝应该修多高、为抵御万年不遇的水灾,堤坝应该修多高、多厚、多强?多厚、多强? 目前以欧美学者为主组成各个研究小组,正目前以欧美学者为主组成各个研究小组,正在运用极值理论对水文学,环境保护,自然灾在运用极值理论对水文学,环境保护,自然灾害,异常气象,可靠性工程,保险数学,金融害
12、,异常气象,可靠性工程,保险数学,金融工程等有特色的应用领域展开研究。工程等有特色的应用领域展开研究。 三、统计学的方法论意义三、统计学的方法论意义 在正确的前提下,我们可以利用在正确的前提下,我们可以利用 从一般从一般 到到 特殊特殊的的演绎推理演绎推理严格证明一个结论的正确性严格证明一个结论的正确性. 从确从确定的前提可以推出有关的确定的事实,我们不定的前提可以推出有关的确定的事实,我们不会对这种问题有太多的敬畏,总有聪明的人可会对这种问题有太多的敬畏,总有聪明的人可以准确地做出这种推理。以准确地做出这种推理。 在许多情况下,我们并不知道正确的前提在许多情况下,我们并不知道正确的前提是什么
13、,仅知道若干并不全面的有关事实。在是什么,仅知道若干并不全面的有关事实。在这种情况下,这种情况下,有许多可能的答案可供选择。有许多可能的答案可供选择。但是,但是,不能准确知道导致这些事实的前提条件不能准确知道导致这些事实的前提条件是什么是什么。 我们都可以用归纳法做出自己的结论,但我们都可以用归纳法做出自己的结论,但是谁也没有把握说自己的结论是正确的。是谁也没有把握说自己的结论是正确的。 归纳法是从若干事实概括出它们的共性的归纳法是从若干事实概括出它们的共性的一种思想方法,其本质特征是:一种思想方法,其本质特征是: 虽然考察的只是若干虽然考察的只是若干个别现象个别现象,但所得的结,但所得的结论
14、却能超出考察的范围。论却能超出考察的范围。 归纳法不仅是一种逻归纳法不仅是一种逻辑推理方法,也是一种科学研究方法,更是一辑推理方法,也是一种科学研究方法,更是一种种科学发现方法科学发现方法。归纳推理,就是要从所有可。归纳推理,就是要从所有可能的结论中挑选出一个自认为是最有可能正确能的结论中挑选出一个自认为是最有可能正确的结论。的结论。当然,用归纳法得出的结论当然,用归纳法得出的结论并非总是正确的并非总是正确的. 认真思考归纳推理,我们要解决以下问题:认真思考归纳推理,我们要解决以下问题: 1、针对一个问题,怎样合理有效地观测记录、针对一个问题,怎样合理有效地观测记录有关事实?有关事实?2、基于
15、已经观测到的事实,有哪些结论可供选、基于已经观测到的事实,有哪些结论可供选择呢?择呢?3、怎样做出最佳选择呢?、怎样做出最佳选择呢?4、做出选择的同时,我们必须同时承担多大出、做出选择的同时,我们必须同时承担多大出错的风险呢?错的风险呢?不确定的知识不确定的知识 + 不确定性的度量不确定性的度量 = 有用的知有用的知识识统计学正是研究这样一种逻辑思维方法的科学。统计学正是研究这样一种逻辑思维方法的科学。也就是说,统计学不仅给出结论,还给出结论也就是说,统计学不仅给出结论,还给出结论的不确定性的准确度量的不确定性的准确度量. 四、统计学的新课题四、统计学的新课题 统计学研究怎样有效地收集、整理、
16、分析统计学研究怎样有效地收集、整理、分析带有随机性的数据,并在此基础上对所研究的带有随机性的数据,并在此基础上对所研究的问题做出推断性结论。问题做出推断性结论。 那么,什么是数据?在信息时代,数据包那么,什么是数据?在信息时代,数据包含着信息,信息体现为数据!用一句更现代的含着信息,信息体现为数据!用一句更现代的话说,统计学就是从具有随机性的有限数据中话说,统计学就是从具有随机性的有限数据中发现有价值的信息的科学。发现有价值的信息的科学。 在过去,我们基本上搞清楚了常规意义下数在过去,我们基本上搞清楚了常规意义下数据的收集与处理问题。但是在信息爆炸的时代,据的收集与处理问题。但是在信息爆炸的时代,非传统数据占主导地位。非传统数据占主导地位。图形数据,图像数据,声音数据,海量数据,图形数据,图像数据,声音数据,海量数据,高维数据,关联数据,网络数据,等等高维数据,关联数据,网络数据,等等急需得到处理,前所未有的问题与挑战摆在了急需得到处理,前所未有的问题与挑战摆在了统计学家们面前。统计学家们面前。 20世纪以来基本成型的统计学的理论框架世纪以来基本成型的统计学的理论框架受到了新的挑战。例