《刘蒋巍:如何识别二项分布问题与超几何分布问题.docx》由会员分享,可在线阅读,更多相关《刘蒋巍:如何识别二项分布问题与超几何分布问题.docx(4页珍藏版)》请在优知文库上搜索。
1、如何识别二项分布问题与超几何分布问题文/刘蒋巍在次伯努利试验中强调试验的独立和重复其实质就是为了保证事件A发生与不发生的概率在每一次试验中是一样恒定不变的,只有概率不变才可以考虑二项分布.而放回抽样可以保证每一次抽取事件A发生与不发生的概率不变,所以是典型的二项分布问题,不放回抽样第一次抽与下一次抽,事件A发生与不发生的概率都在变化,不符合二项分布条件,所以使用超几何分布来处理.比如在不放回次摸球试验中,摸到某种颜色球的次数服从超几何分布,但是当袋子中的球的数目很大时,X的分布近似于二项分布,并且随着球的数目N的增加,这种近似的精度也在增加,所以用二项分布近似来处理超几何分布,可以减少计算量,
2、这种近似处理的思想方法经常用到,如用频率来代替概率.二项分布与超几何分布的关系在次试验中,某事件A发生的次数X可能服从超几何分布或二项分布.区别(1)当这次试验是独立重复试验时(如有放回摸球),X服从二项分布;(2)当这次试验不是独立重复试验时(如不放回摸球),X服从超几何分布联系在不放回次试验中,如果总体数量N很大,而试验次数很小,此时超几何分布可近似转化成二项分布【案例分析】【案例1一个盒子中有10个小球,其中3个红球,7个白球.从这10个球中任取3个.(1)若采用无放回抽取,设取出的3个球中红球的个数为X,求X的分布列及期望;【解答】由题意知,X的可能取值为0,123,则P(X=O)=品
3、=含=方,ax=i)=普=粉焉,P(X=2)=詈=林,(X=3)=I.所以X的分布列为X012372171P244040120721719则即O=OXm+I而+2x而+3x两=而(2)若采用有放回抽取,求取出的3个球中红球的个数Y的分布列及期望.【解答】由题意知,y的可能取值为0,123,且Y8(3,前所以P(y=)=(13=三p(y=1)=ci(1-2=oPG=2)=cM)2(IY)=搞,尸(丫=3)=阖3=磊,所以Y的分布列为Y012334344118927P1(MM)10001000100039则E(Y)=3xf=而.【案例2】某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水
4、线上的40件产品作为样本称出它们的质量(单位:g),质量的分组区间为(490,495,(495,500,(510,515,由此得到样本的频率分布直方图如图所示.(1)根据频率分布直方图,求质量超过505g的产品数量;【解答】质量超过505g的产品的频率为5x0.05+5x0.01=0.3,所以质量超过505g的产品数量为40x0.3=12(件).(2)在上述抽取的40件产品中任取2件,设X为质量超过505g的产品数量,求X的分布列及均值;【解答】质量超过505g的产品数量为12件,则质量未超过505g的产品数量为28件,X的可能取值为0,1,2,X服从超几何分布,则P(X=O)=窘=哥,P(X
5、=D=P(X=2)=恶=忐所以X的分布列为XO12P63T30286511BO所以E(X)=0-+l+2x=.(3)从该流水线上任取2件产品,设丫为质量超过505g的产品数量,求y的分布列.【解答】根据样本估计总体的思想,取一件产品,该产品的质量超过505g1?3的概率为%=从流水线上任取2件产品互不影响,该问题可看成2重伯努利试验,质量超过505g的件数Y的可能取值为0,1,2,且丫8(2,匐,P(Y=Ic)=c5(一书2人=。2所以RY=。)=。8阖2=盖p(y=i)=clxw=Io,P(y=2)=c3f)2=T?所以y的分布列为YO12P49Too21509Too【案例3】中国北斗卫星导
6、航系统是中国自行研制的全球卫星导航系统,作为国家战略性空间基础设施,我国北斗卫星导航系统不仅对国防安全意义重大,而且在民用领域的精准化应用也越来越广泛.2020年6月23日,中国第55颗北斗导航卫星成功发射标志着拥有全部知识产权的北斗卫星导航系统全面建成.据统计,2019年卫星导航与位置服务产业总产值达到3450亿元,较2018年约增长14.4%.从全球应用北斗卫星的城市中选取了40个城市进行调研,如图所示是这40个城市北斗卫星导航系统与位置服务产业的产值(单位:万元)的频率分布直方图.(1)根据频率分布直方图,求产值小于600万元的调研城市个数;【解答】由频率分布直方图可知产值小于600万元
7、的频率为(0.03+0.04)x5=0.35,所以产值小于600万元的调研城市个数为40x0.35=14.(2)在上述抽取的40个城市中任取2个,设Y为产值不超过600万元的城市个数,求Y的分布列、期望和方差;【解答】由得产值不超过600万元的调研城市有14个,超过600万元的调研城市有4014=26(个),所以随机变量Y的取值可能为0,1,2,则P(Y=)=il=*PG=D=为鲁=春p(y=2)=强,所以丫的分布列为Y012P5n7157605777(1S(1故E(n=0x五+Ix记+2x而=而,0(F)=8一旬2ji+(一司2记+(2,W_=磔*10;x60-300(3)把频率视为概率,从全球应用北斗卫星的城市中任取5个城市,求恰有3个城市的产值超过605万元的概率.【解答】由频率分布直方图可知城市的产值超过605万元的概率为(0.05+O.O1)5=O.3,设任取5个城市中城市的产值超过605万元的城市个数为X,可知随机变量X满足X3(5,0.3),所以尸(X=3)=CgXO.33x(10.3)2=0.1323.