中科大概率论与数理统计讲义03随机变量的数字特征.docx

资源描述

《中科大概率论与数理统计讲义03随机变量的数字特征.docx》由会员分享，可在线阅读，更多相关《中科大概率论与数理统计讲义03随机变量的数字特征.docx（17页珍藏版）》请在优知文库上搜索。

1、第三章随机变量的数字特征教学目的：1）理解随机变量的数学期望、方差的概念,并会运用它们的基本性质计算具体分布的期望、方差.2）掌握二项分布、PoiSSon分布、均匀分布、指数分布、正态分布的数学期望和方差.3）会根据随机变量的概率分布计算其函数的数学期望.4）理解协方差、相关系数的概念,掌握它们的性质,并会利用这些性质进行计算，了解矩的概念.5）理解大数定理与中心极限定理0在前章中,我们讨论了随机变量的概率分布,这种分布是随机变量的概率论性质最完整的刻画.而随机变量的数字特征是某些由随机变量的分布所决定的常数，它刻画了随机变量或者说刻画了其分布的某一方面的性质,这些性质往往是实际应用中

2、人们比较关心的.例如，我们在了解某一行业工人的经济状况时,我们首先关心的恐怕会是其平均收入,这会给我们一个总体的印象,而收入的分布状况,倒不一定是最重要的,这就是刻画总体平均值的数字特征.另一类重要的数字特征,是用来衡量随机变量取值的分散程度.还拿我们上个例子说明，如果我们考虑两个行业工人的经济状况，他们的平均收入大体相近,但是一个行业收入分配较平均，即大多数人的收入都在平均值上下不远处, 分散程度就小;另一个行业则相反,其收入远离平均值很多，分散程度就大,这两者的实际意义当然很不相同.平均值和分散度是刻画随机变量性质的两类最重要的数字特征. 除了这两者之外，对于多维变量而言，还有

3、一类刻画各分量之间关系的数字特征，较为常用的是协方差和相关系数,这些我们将在下面的章节详细讨论.数字特征另一个重要意义在于,当我们不知道随机变量的确切概率分布,但是清楚其数字特征的情形下,我们可以根据这些数字特征推断该随机变量大致的概率性质.比如某个工厂生产一批灯泡, 我们想了解这批灯泡的质量如何.我们不知道这批灯泡寿命的确切概率分布,但是如果我们知道这批灯泡的平均寿命,知道这批灯泡寿命的分散程度,那我们就可以大致推断出这批灯泡的质量状况.?3.1数学期望（均值）及中位数?3.1.1数学期望数学期望也称均值,是随机变量的一个最基本的数字特征.我们先看如下的一个例子例3.1.1. 一

4、甲乙两人赌技相同,各出赌金1。0元，约定先胜三局者为胜,取得全部200元. 现在甲胜2局乙胜1局的情况下中止，问赌本该如何分？解：如果继续赌下去而不中止,则甲有3/4的概率取胜,而乙胜的概率为1/4.所以,在甲胜2局乙胜1局的这个情况下，甲能期望“得到”的数目，应当确定为3 I _200 - + 0 X - = 150（元），而乙能“期望”得到的数目，则为200 0 彳=50（元）.如果引进一个随机变量X , X等于在上述局面（甲值2胜乙1胜）之下，继续赌下去甲的最终所得,则X有两个可能的值：200和0,其概率分别为3/4和1/4.而甲的期望所得, 即X的“期望”值，即等于X的可能值与其概

5、率之积的累加这就是“数学期望”这个名称的由来.另一个名称“均值”形象易懂,也很常用.下面我们就给出数学期望（均值）的定义：对一般的离散型分布,我们有定义3.1.1 ,设X为一离散型随机变量，其分布律为P（X = Xi） = pi, i = 1, 2,.如果xp +o,则称XiPii=1为随机变量X的数学期望（均值），用符号EX表示.若IxilPi= +。，则称X的数学期望（均值）不存在.对连续型随机变量,其数学期望的定义如下定义3.1.2.如果连续型随机变量X具有密度函数f(x),则当 j xf (x)dx m=4 .均匀分布X U a, b:5 .指数分布X Exp():EX = 1?3

6、.1.2数学期望的性质1 .若干个随机变量线性组合的期望,等于各变量期望的线性组合.假设Cl ,C2, .,Cn 为常数,则有E(C1 Xl + C22 + . . . + CnXn) = C1 EXl + C22 + . . . + CnEXn ,这里假定各变量的期望都存在.例3.1.2.假设随机变量X B (n, p),求EX .解：令Ii B(1, p), i = 1, 2, . . . , n,则X = h 且Eh = p.所以，EX =Eli = np.2 .若干个独立随机变量之积的期望,等于各变量的期望之积，即E (X12 . . . Xn) = EXl E2 . . . EXn

7、,这里假定各变量相互独立且期望都存在.3 .(随机变量函数的期望)设随机变量X为离散型，有分布P(X = ai) =Pi, i = 1,2,.,或者为连续型,有概率密度函数f (X).则9Eg(X)= 尸八尸 J(4l 卅 X二队)/(才bG)l3“ EX2 = X2 .e dx=1.所以，EY = EX2 + 1 = 2.例3.1.5.飞机场载客汽车上有20位乘客，离开机场后共有io个车站可以下车,若某个车站没有人下车则该车站不停车.设乘客在每个车站下车的可能性相等，以X表示停车的次数,求EX .解：设，1第i个车站有人下车.Y= 0,第i个车站无人下车 = ,420则显然X=Yi,所

8、以i=12020EX = EYi= * P (第i个车站有人下车)i= 1i=120=【1 - 0.920 = 8.784.?3.1.3条件期望我们知道条件分布也是一个概率分布，因此类似数学期望的定义,我们可以给出条件期望的定义.在给定了随机变量X取值X的条件之下,丫的条件期望,我们记为E(YlX = X),也可简记为E(YlX).定义3.1.3.设X和Y为随机变量，若(X, Y)为离散型,且在给定X = X之下,Y有分布P(Y = aX = x) = pi, i= 1,2.,或者(X, Y)为连续型，且在给定X = X之下,Y的条件密度函(X. Y)为连续型;(X, Y)为离散型.数为f

9、(y) .则E (Y X = X)期望所具有的性质条件期望同样满足.例 3.1.6.设(X, 丫) N (a, b, ?, , p),试计算E(YlX = x).解：由于Y X = X N (b + PM(X - a), (1 - p2 )/),所以由二维正态分布的性质知E(Y X = x) = b + p (x - a).:条件期望E(YIX = X)是X的函数，当我们将X换为X时，E (YX)就是一个随机变量.我们有如下的公式成立: 定理3.1.1.设X, Y为两个随机变量.则有EX = E EXY)全期望公式证：我们仅在连续型随机变量的情形下证明此定理.设Y的Pdf为p(y),XY =

10、y的pdf为q(xy). 则EX = q(xy)p(y)dxdy =,q(xy)dxp(y)dy = , E XY = yp(y)dy=EEY)推广：当g(X )为可积随机变量时,有Eg(X ) = EEg(X )Y).由此得到求解期望的第二种方法：先求解h(x) = E(YlX = X),再求解Eh(X ),即可求得EY .例3.1.7. 一窃贼被关在有3个门的地牢里,其中第一个门通向自由.出这门走3个小时便可以回到地面；第2个门通向另一个地道,走5个小时将返回到地牢；第3个门通向更长的地道，走7个小时也回到地牢.若窃贼每次选择3个门的可能性总相同，求他为获得自由而奔走的平均时间.解

11、：设这个窃贼需要走X小时才能到达地面,并设Y代表他每次对3个门的选择情况,Y各以1/3的概率取值1,2, 3.则3EX = E E (XY)l = E (XY = i)P (Y = i)i=1注意到E(XlY =1) = 3, E(XY = 2) = 5 + EX, E(XY = 3) = 7 + EX ,所以EX=H3 + 5 + EX + 7 + EX即得到EX= 15.例 3.1.8.设(X, Y) N (a, b, f, /, p),试计算EXY .解：先算得E (XY X = x) = xE (Y X = x) = x(b + p (x - a); 所以EXY = E (bX + p

12、打2 - p %X )=ab + p (a2 + ?) - p Ll2 1 1=ab + p 1 2.?3.1.4 中位数我们已经知道,随机变量X的数学期望就是它的平均值，因此从一定意义上,数学期望刻画了随机变量所取之值的“中心位置” .但是,我们也可以用别的数字特征来刻画随机变量的“中心位置”.中位数就是这样一种数字特征.定义3.1.4.称为连续型随机变量X的中位数,如果P (X )=.从定义上可以看出，m这个点把X的分布从概率上一分两半:在m左边占一半，m右边也占一半,从概率上说，m这个点正好居于中央,这就是“中位数”得名的由来.在实用上，中位数用得很多，特别有不少社会统计资料，

13、常拿中位数来刻化某种量的代表性数值,有时它比数学期望更说明问题,例如,某社区内人的收入的中位数告诉我们：有一半人的收入低于此值,另一半高于此值.我们直观上感觉到这个值对该社区的收入情况, 的确很具有代表性,和期望值相比它的一个优点是受个别特别大或特别小的值的影响很小,而期望则不然,举例而言,若该社区中有一个收入在百万元以上,则该社区的均值可能很高,而绝大多数人并不富裕,这个均值并不很有代表性，中位数则不然,它几乎不受少量这种特大值的影响.从理论上说，中位数与均值相比还与一个优点，即它总存在，而均值则不是对任何随机变量都存在.虽则中位数有这些优点,但在概率统计中，无论理论和应用上,数学期望的重要性都超过中位数,其原因有一下两个方面：1.均值有很多优良的性质，这些性质时使得在数学处理上很方便.例如，E (Xi X2) = EXi EX2 ,而M + X2的中位数与刈，X2各自的中位数之间，不存在简单的联系, 这使中位数在数学上的处理很复杂且不方便；2.中位数本身固有的某些缺点,中位数可以不唯一,且对于离散型随机变量不易定义.例3.1.9.设随机变量XB(1, ),求X的中位数.解：由于X的分布函数为O, X 1由中位数的定义知区间(0,1)内的每一个数都是X的中位数所以此例说明中位数可以不唯一.?3.2方差、标准差和矩?3.2.1方差和标

展开阅读全文