《中科大概率论与数理统计讲义03随机变量的数字特征.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义03随机变量的数字特征.docx(17页珍藏版)》请在优知文库上搜索。
1、第三章随机变量的数字特征教学目的:1)理解随机变量的数学期望、方差的概念,并会运用它们的基本性质计算具体分布的 期望、方差.2)掌握二项分布、PoiSSon分布、均匀分布、指数分布、正态分布的数学期望和方差.3)会根据随机变量的概率分布计算其函数的数学期望.4)理解协方差、相关系数的概念,掌握它们的性质,并会利用这些性质进行计算,了解 矩的概念.5)理解大数定理与中心极限定理0在前章中,我们讨论了随机变量的概率分布,这种分布是随机变量的概率论性质最 完整的刻画.而随机变量的数字特征是某些由随机变量的分布所决定的常数,它刻画了 随机变量或者说刻画了其分布的某一方面的性质,这些性质往往是实际应用中
2、人们比较 关心的.例如,我们在了解某一行业工人的经济状况时,我们首先关心的恐怕会是其平 均收入,这会给我们一个总体的印象,而收入的分布状况,倒不一定是最重要的,这就是 刻画总体平均值的数字特征.另一类重要的数字特征,是用来衡量随机变量取值的分散 程度.还拿我们上个例子说明,如果我们考虑两个行业工人的经济状况,他们的平均收 入大体相近,但是一个行业收入分配较平均,即大多数人的收入都在平均值上下不远处, 分散程度就小;另一个行业则相反,其收入远离平均值很多,分散程度就大,这两者的实 际意义当然很不相同.平均值和分散度是刻画随机变量性质的两类最重要的数字特征. 除了这两者之外,对于多维变量而言,还有
3、一类刻画各分量之间关系的数字特征,较为 常用的是协方差和相关系数,这些我们将在下面的章节详细讨论.数字特征另一个重要 意义在于,当我们不知道随机变量的确切概率分布,但是清楚其数字特征的情形下,我们 可以根据这些数字特征推断该随机变量大致的概率性质.比如某个工厂生产一批灯泡, 我们想了解这批灯泡的质量如何.我们不知道这批灯泡寿命的确切概率分布,但是如果 我们知道这批灯泡的平均寿命,知道这批灯泡寿命的分散程度,那我们就可以大致推断 出这批灯泡的质量状况.?3.1数学期望(均值)及中位数?3.1.1数学期望数学期望也称均值,是随机变量的一个最基本的数字特征.我们先看如下的一个例 子例3.1.1. 一
4、甲乙两人赌技相同,各出赌金1。0元,约定先胜三局者为胜,取得全部200元. 现在甲胜2局乙胜1局的情况下中止,问赌本该如何分?解:如果继续赌下去而不中止,则甲有3/4的概率取胜,而乙胜的概率为1/4.所以,在甲 胜2局乙胜1局的这个情况下,甲能期望“得到”的数目,应当确定为3 I _200 - + 0 X - = 150(元),而乙能“期望”得到的数目,则为200 0 彳=50(元).如果引进一个随机变量X , X等于在上述局面(甲值2胜乙1胜)之下,继续赌下去甲 的最终所得,则X有两个可能的值:200和0,其概率分别为3/4和1/4.而甲的期望所得, 即X的“期望”值,即等于X的可能值与其概
5、率之积的累加这就是“数学期望”这个名称的由来.另一个名称“均值”形象易懂,也很常用.下面我们 就给出数学期望(均值)的定义:对一般的离散型分布,我们有定义3.1.1 ,设X为一离散型随机变量,其分布律为P(X = Xi) = pi, i = 1, 2,.如果xp +o,则称XiPii=1为随机变量X的数学期望(均值),用符号EX表示.若IxilPi= +。,则称X的数学期 望(均值)不存在.对连续型随机变量,其数学期望的定义如下定义3.1.2.如果连续型随机变量X具有密度函数f(x),则当 j xf (x)dx m=4 .均匀分布X U a, b:5 .指数分布X Exp():EX = 1?3
6、.1.2数学期望的性质1 .若干个随机变量线性组合的期望,等于各变量期望的线性组合.假设Cl ,C2, .,Cn 为常数,则有E(C1 Xl + C22 + . . . + CnXn) = C1 EXl + C22 + . . . + CnEXn ,这里假定各变量的期望都存在.例3.1.2.假设随机变量X B (n, p),求EX .解:令Ii B(1, p), i = 1, 2, . . . , n,则X = h 且Eh = p.所以,EX =Eli = np.2 .若干个独立随机变量之积的期望,等于各变量的期望之积,即E (X12 . . . Xn) = EXl E2 . . . EXn
7、,这里假定各变量相互独立且期望都存在.3 .(随机变量函数的期望)设随机变量X为离散型,有分布P(X = ai) =Pi, i = 1,2,.,或者为连续型,有概率密度函数f (X).则9Eg(X)= 尸八 尸 J(4l 卅 X二队)/(才bG)l3“ EX2 = X2 .e dx=1.所以,EY = EX2 + 1 = 2.例3.1.5.飞机场载客汽车上有20位乘客,离开机场后共有io个车站可以下车,若某个车 站没有人下车则该车站不停车.设乘客在每个车站下车的可能性相等,以X表示停车的 次数,求EX .解:设,1第i个车站有人下车.Y= 0,第i个车站无人下车 = ,420则显然X=Yi,所
8、以i=12020EX = EYi= * P (第i个车站有人下车)i= 1i=120=【1 - 0.920 = 8.784.?3.1.3条件期望我们知道条件分布也是一个概率分布,因此类似数学期望的定义,我们可以给出条 件期望的定义.在给定了随机变量X取值X的条件之下,丫的条件期望,我们记为E(YlX = X),也可简记为E(YlX).定义3.1.3.设X和Y为随机变量,若(X, Y)为离散型,且在给定X = X之下,Y有分布P(Y = aX = x) = pi, i= 1,2.,或者(X, Y)为连续型,且在给定X = X之下,Y的条件密度函(X. Y)为连续型;(X, Y)为离散型.数为f
9、(y) .则E (Y X = X)期望所具有的性质条件期望同样满足.例 3.1.6.设(X, 丫) N (a, b, ?, , p),试计算E(YlX = x).解:由于Y X = X N (b + PM(X - a), (1 - p2 )/),所以由二维正态分布的性质知E(Y X = x) = b + p (x - a).:条件期望E(YIX = X)是X的函数,当我们将X换为X时,E (YX)就是一个随机变量.我们有如下的公式成立: 定理3.1.1.设X, Y为两个随机变量.则有EX = E EXY)全期望公式证:我们仅在连续型随机变量的情形下证明此定理.设Y的Pdf为p(y),XY =
10、y的pdf为q(xy). 则EX = q(xy)p(y)dxdy =,q(xy)dxp(y)dy = , E XY = yp(y)dy=EEY)推广:当g(X )为可积随机变量时,有Eg(X ) = EEg(X )Y).由此得到求解期望的第二种方法:先求解h(x) = E(YlX = X),再求解Eh(X ),即可 求得EY .例3.1.7. 一窃贼被关在有3个门的地牢里,其中第一个门通向自由.出这门走3个小时便 可以回到地面;第2个门通向另一个地道,走5个小时将返回到地牢;第3个门通向更长的 地道,走7个小时也回到地牢.若窃贼每次选择3个门的可能性总相同,求他为获得自由 而奔走的平均时间.解
11、:设这个窃贼需要走X小时才能到达地面,并设Y代表他每次对3个门的选择情况,Y各以1/3的概率取值1,2, 3.则3EX = E E (XY)l = E (XY = i)P (Y = i)i=1注意到E(XlY =1) = 3, E(XY = 2) = 5 + EX, E(XY = 3) = 7 + EX ,所以EX=H3 + 5 + EX + 7 + EX即得到EX= 15.例 3.1.8.设(X, Y) N (a, b, f, /, p),试计算EXY .解:先算得E (XY X = x) = xE (Y X = x) = x(b + p (x - a); 所以EXY = E (bX + p
12、 打2 - p %X )=ab + p (a2 + ?) - p Ll2 1 1=ab + p 1 2.?3.1.4 中位数我们已经知道,随机变量X的数学期望就是它的平均值,因此从一定意义上,数学期 望刻画了随机变量所取之值的“中心位置” .但是,我们也可以用别的数字特征来刻画随 机变量的“中心位置”.中位数就是这样一种数字特征.定义3.1.4.称为连续型随机变量X的中位数,如果P (X )=.从定义上可以看出,m这个点把X的分布从概率上一分两半:在m左边占一半,m右 边也占一半,从概率上说,m这个点正好居于中央,这就是“中位数”得名的由来.在实 用上,中位数用得很多,特别有不少社会统计资料,
13、常拿中位数来刻化某种量的代表性 数值,有时它比数学期望更说明问题,例如,某社区内人的收入的中位数告诉我们:有一 半人的收入低于此值,另一半高于此值.我们直观上感觉到这个值对该社区的收入情况, 的确很具有代表性,和期望值相比它的一个优点是受个别特别大或特别小的值的影响很 小,而期望则不然,举例而言,若该社区中有一个收入在百万元以上,则该社区的均值可 能很高,而绝大多数人并不富裕,这个均值并不很有代表性,中位数则不然,它几乎不受 少量这种特大值的影响.从理论上说,中位数与均值相比还与一个优点,即它总存在,而均值则不是对任何 随机变量都存在.虽则中位数有这些优点,但在概率统计中,无论理论和应用上,数学期 望的重要性都超过中位数,其原因有一下两个方面:1.均值有很多优良的性质,这些性质时使得在数学处理上很方便.例如,E (Xi X2) = EXi EX2 ,而M + X2的中位数与刈,X2各自的中位数之间,不存在简单的联系, 这使中位数在数学上的处理很复杂且不方便;2.中位数本身固有的某些缺点,中位数可以不唯一,且对于离散型随机变量不易定义.例3.1.9.设随机变量XB(1, ),求X的中位数.解:由于X的分布函数为O, X 1由中位数的定义知区间(0,1)内的每一个数都是X的中位数所以此例说明中位数可 以不唯一.?3.2方差、标准差和矩?3.2.1方差和标