《抽样方法简单随机抽样(抽签法.docx》由会员分享,可在线阅读,更多相关《抽样方法简单随机抽样(抽签法.docx(5页珍藏版)》请在优知文库上搜索。
1、抽样方法简单随机抽样(抽签法1.抽样方法:(1)简单随机抽样(抽签法、随机数表法)常常用于总体个数较少时,它的特征是从总体中逐个抽取;(2)系统抽样也叫等距离抽样,常用于总体个数较多时,它的要紧特征是均衡成若干部分,每部分只取一个;(3)分层抽样,要紧特征是分层按比例抽样,要紧用于总体中有明显差异,它们的共同点:每个个体被抽到的概率都相等2,表达了抽样的客观性与平等N性。如(1)某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95。为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,把这种抽样记为A;某中学高中一年级有12名女排运动员,要从中选取3人
2、调查学习负担的情况,把这种抽样记为B,那么完成上述两项调查应分别使用的抽样方法:A为,B为。(答:分层抽样,简单随机抽样);(3)某中学有高一学生400人,高二学生300人,高三学生300人,现通过分层抽样抽取一个容量为n的样本,已知每个学生被抽到的概率为0.2,则n=(答:200):(4)容量为100的样本拆分成10组,前7组的频率之与为0.79,而剩下的三组的频数构成等比数列,且其公比不为1,则剩下的三组中频数最大的一组的频率是(答:0.16);(5)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为2的样本,则某一个体。”第一次被抽到的概率”,“第一次未被抽到,第二次被抽到的概
3、率”,“在整个抽样过程中被抽到的概率”分别是(答:2.总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值一一描述一个总体的平均水平);用样本方差估计总体方差(方差与标准差是描述个样本与总体的波动大小的特征数,方差或者标准差越小,表示这个样本或者总体的波动越小,即越稳固)。通常地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2表图”(频率分布直方图)。频率分布直方图的特征:(1)从频率分布直方图能够清晰的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数
4、据信息就被抹掉了。频率直方图的作法:(1)算数据极差(max-in(2)决定组距与组数;(3)决定分点:(4)列频率分布表:(5)画频率直方图。提醒:直方图的纵轴(小矩形的高)通常是频率除以组距的商(而不是频率),横轴通常是数据的大小,小矩形的面积表示频率组数的决定方法是:设数据总数目为n,50时,分为58组:5Ov21OO时,分为812组.如(1)一个容量为20的样本数据,分组后组距与频数如下:(10,20,2:(20,30,3;(30,40,4;(40,50,5;(50.60,4;(60.70,2;则样本在区间(-50,50上的频率为A.5%B.25%C.50%D.70%(答:D):(2)
5、已知样本:10861013810121178911912910111212,那么频率为0.3的范围是A.5.57.5B.7.59.5C.9.511.5D.11.513.5(答:B);(3)观察新生儿的体重,其频率分布直方图如图所示,则新生儿的体重在2700,3000的频率为(答:0.3):(4)如图.是一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是(答:120):(5)有同一型号的汽车I(X)辆,为熟悉这种汽车每蛀油IL所行路程的情况,现从中随即抽出分组频数频率112.45,12.95)12.95,13.45)13.45,13.95)
6、13.95,14.45)合计101.010辆在同一条件下进行期油IL所行路程实验,得到如下样本数据(单位:km):13.7,12.7,14.4,13.8,133,12.5.13.5.13.6.13.1,13.4,其分组如下:(1)完成上面频率分布表;(2)根据上表,在给定坐标系中画出频率分布直线图,并根据样本估计总体数据落在12.95,13.95)中的概率;(3)根据样本,对总体的期望值进行估计解:(1)频率分布表:分组频数频率12.45,12.95)20.212.95,13.45)30.313.45,13.95)40.413.95,14.45)10.1估计总体数据落在12.95,13.95)
7、中的概率为0.7估计总体数据落在12.95,13.95)中的概率为0.7频率/组距(3)0.81.0.7+(0.3)+1.4+0.80.3+(-0.5)+0.50.6+0.10.410=13.4因此,总体的期望值进行估计约为13.4.合计101.012.45 12.95 13.45 13.95 14.45 路程 (a(2 ) 频率分布直方图(6)为了熟悉高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数
8、在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之与等于样本容量,频率之与等于1。0.08150解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率2+4+17+15+9+3又由于频率=第:小组频数样本容量样本容量=第二小组频数=卫“不用一第二小组频率一0.08(2)由图可估计该学校高一学生的达标率约为D土丝土2巨_X100%=88%2417159+3(3)由已知可得
9、各小组的频数依次为6,12,51,45,27,9,所往常三组的频数之与为69,前四组的频数之与为114,因此跳绳次数的中位数落在第四小组内。3、样本平均数:=-(x1+2+X11)=-YXz0/=I如有一组数据:Xi3,Vn(.ri2-Xn)它们的算术平均值为20,若去掉其中的Xn,余下数据的算术平均值为18,则Xn关于n的表达式为(答:Xrt=2n+18)4、样本方差:J_$2=一K%-X)2+(2-X)2+(xn-X)2本标准差:-U1-X)2+-X)2+Um-X)2n如(1)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下衣i+组别统平均分方差第1组8016第2
10、组9036(单位:环)甲108999乙1010799假如甲、乙两人中只有1人入选,则入选的应是(答:甲);(2)已知实数2,冗2,2)的期望值_1n为X,方差为S,m2(七一。),若n泊ax,则一定有a.S2mB.S2%q5,说明95%的把握认为X与Y之间具备线性有关关系,假如N莅05,同意假设.提醒:A与B有关并不意味着A的发生必定导致B的发生.7 .回归分析回归分析是对具有有关关系的两个或者两个以上变量之间数量变化的通常关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。在回归分析中,由X推算Y与由Y推算X的回归方程是不一致的,不可混淆
11、:由X推y6=用”L=y-bx(D由y推X人生.既(yi-yY.与有关分析相比,回归分析的特点是:两个变量是不对等的,只能用自变量来估计因变量,而不同意由因变量来推测自变量,务必区分自变量,通常说,事物的原因作自变量X.回归分析与有关分析是互相补充、密切联系的。有关分析需要回归分析来说明现象数量有关的具体形式,而回归分析则应该建立在有关分析的基础上。依靠有关分析说明现象的数量变化具有密切有关,进行回归分析求其有关的具体形式才有意义。如(1)在研窕色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520个女性中6人患色百,(1)根据以上的数据建立一个2X2的列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少解:(1)患色盲不患色盲总计男38442480女6514520总计449561000(2)假设H:“性别与患色盲没有关系”先算出K的观测值:f1000(38514-442