《商务统计学Ch08.ppt》由会员分享,可在线阅读,更多相关《商务统计学Ch08.ppt(53页珍藏版)》请在优知文库上搜索。
1、Chap 8-1第8章置信区间估计商务统计学(第5版)Chap 8-2学习目标在本章中你将学到:在本章中你将学到:n 构建和理解均值和比例的置信区间估计n 如何根据所要得到的均值和比例的置信区间确定样本容量Chap 8-3章节提纲本章内容本章内容n总体均值, 的置信区间n当总体标准差已知n当总体标准差未知n总体比例, 的置信区间n确定所需的样本容量Chap 8-4点估计和区间估计n点估计是单个数值n置信区间提供了估计变动的额外信息点估计点估计置信区间下界置信区间下界置信区间上界置信区间上界置信区间宽度置信区间宽度Chap 8-5能够估计总体参数 点估计样本统计量(点估计)均值比例pXChap
2、8-6置信区间n有多少不确定性是与总体参数的点估计相关?n区间估计比点估计提供了总体特征的更多信息n这样的区间估计称为置信区间Chap 8-7置信区间估计n区间给出了观测值的一个范围:n考虑样本统计量随着样本的不同而变化n基于一个样本的观测值n给出接近未知总体参数的信息n以置信度表示n例如95%的置信度, 99%的置信度n不能为100%的置信度Chap 8-8置信区间例子麦片包装例子n 总体的 = 368且 = 15n 如果取容量n = 25的样本,你知道n368 1.96 * 15 / = (362.12, 373.88) 包括95% 的样本均值n当不知道时, 使用X 来估计 n如果X =
3、362.3 ,区间为362.3 1.96 * 15 / = (356.42, 368.18)n既然356.42 368.18, 基于此样本的区间正确的表述了但,其他可能容量为25的样本的区间如何?2525Chap 8-9置信区间例子(续)样本号X下界上界包含?1362.30356.42368.18是2369.50363.62375.38是3360.00354.12365.88否4362.12356.24368.00是5373.88368.00379.76是Chap 8-10置信区间例子n实践中只选择一个容量为n 的样本n实践中不知道,因此也不知道 区间是否真正包含n但是知道以这种方式构造的区间
4、95%的包含n因此,基于这个样本,可以有95%的把握相信区间包含 (这就是置信度是95%的置信区间)(续)注意: 95% 置信区间是基于我们使用Z = 1.96的事实Chap 8-11估计过程(均值均值, , 未知未知)总体随机样本均值均值 X = 50样本样本95%的置信度的置信度 介于介于40 和和60之间之间Chap 8-12一般公式n所有置信区间的一般公式为 :点估计点估计 (临界值临界值)(标准差标准差)其中:点估计是样本统计量估计总体参数临界值是点估计和所要求的置信度的抽样分布产生的值标准差是点估计的标准误差Chap 8-13置信度n置信度n置信区间包含未知总体参数n百分数(低于1
5、00%)Chap 8-14置信度, (1-)n假设置信度=95% n也可写成(1 - ) = 0.95,(故 = 0.05)n一般的相关解释:n构造的所有置信区间95%包含未知的真实参数n特别的,区间可以包含也可以不包含真实参数n没有可能包含在一个特殊区间里(续)Chap 8-15置信区间总体均值总体均值 未知未知置信区间置信区间总体比例总体比例 已知已知Chap 8-16的置信区间 (已知) n假设n总体标准差已知n总体是正态分布n如果总体非正态,则使用大样本n置信区间估计: 其中 是点估计 Z/2 是正态分布的临界值以上的比例为/2对应的数值 是标准差 n/2ZXXn/Chap 8-17寻
6、找临界值,Z/2n考虑置信度是95%的置信区间:Z/2 = -1.96Z/2 = 1.9610.95 0.05, 所以0.02520.0252点估计点估计置信下限置信下限临界值临界值置信上限置信上限临界值临界值Z :X :点估计点估计01.96/2ZChap 8-18常用置信度n通常使用的置信度是 90%,95%,和99%置信度置信度置信系数置信系数, Z/2 值值1.281.6451.962.332.583.083.270.800.900.950.980.990.9980.99980%90%95%98%99%99.8%99.9%1Chap 8-19x置信区间和置信度置信区间区间从 扩展到 (
7、1-)x100%区间包含;()x100% 不包含均值的样本分布n2/ZX n2/ZX xx1x2/2/21Chap 8-20例子n正态总体中的11个电路样本均值电阻为2.20欧姆。从以往的测试中知道总体标准差是0.35欧姆。n确定总体电阻真实均值的置信度是95%的置信区间。Chap 8-212.4068 1.99320.2068 2.20)11(0.35/ 1.96 2.20n/2 ZX例子n正态总体中的11个电路样本均值电阻为2.20欧姆。从以往的测试中知道总体标准差是0.35欧姆。n解答:(续)Chap 8-22解释n我们95%的确定真实均值电阻在1.9932和2.4068欧姆之间 n尽管
8、真实均值可能在也可能不在这个区间,但是此种方法形成的区间95%的包含真实均值Chap 8-23置信区间总体均值总体均值 未知未知置信区间置信区间总体比例总体比例 已知已知Chap 8-24你知道实际上的吗?n可能不知道!n几乎在所有的实际商业应用中,是未知的 n如果有一种情形,是知道的,那么也将是知道的(因为计算需要用到)n如果你真实的知道,则不需要收集样本去估计它。Chap 8-25n如果总体标准差 是未知的,我们可以用样本标准差S来替代。 n这种做法是非常不确定的,因为S随着样本的变化而变化。 n所以我们用t分布来代替正态分布。的置信区间 (未知)Chap 8-26n假设n总体标准差是未知
9、的n总体服从正态分布n如果总体比服从正态,则使用大样本n用学生t分布n置信区间估计:(其中 t/2 是具有n -1自由度和/2的累积面积的t分布的临界值) 的置信区间 (未知)nStX2/(续)Chap 8-27学生t分布nt 是一个分布集nt/2 的值依赖于自由度 (d.f.)n观察值在样本均值计算后是自由变化的 d.f. = n - 1Chap 8-28如果这三个数的均值是8.0, 那么X3一定是9 (即, X3 不是自由变化的)自由度 (df)这里,n = 3,所以自由度= n 1 = 3 1 = 2(对于一个给定的均值,2个值可以是任意的数字,但是第三个数是不能自由变化的)思想:观察值
10、在样本均值计算后是自由变化的例子:例子:假设3个数字的均值是8.0 令X1 = 7令X2 = 8X3是多少?Chap 8-29学生t分布t0t (df = 5) t (df = 13)t-分布是钟形的对称的,但其尾部比正态的“胖”标准正态(t 有df = )注意: t Z 是n增加Chap 8-30学生t分布表上部的尾部面积上部的尾部面积df.25.10.0511.000 3.078 6.31420.817 1.886 2.92030.765 1.638 2.353t02.920表的主体包含t值,但没有概率令: n = 3 df = n - 1 = 2 = 0.10 /2 = 0.05/2 =
11、 0.05Chap 8-31选择t分布值与Z值进行比较 置信置信 t t t Z 度度 (10 d.f.) (20 d.f.) (30 d.f.) ( d.f.) 0.80 1.372 1.325 1.310 1.28 0.90 1.812 1.725 1.697 1.645 0.95 2.228 2.086 2.042 1.96 0.99 3.169 2.845 2.750 2.58注意: t Z 是n增加Chap 8-32t分布的置信区间例子2.06390.025t/2t258(2.0639)50nS/2tX46.698 53.302 一个随机样本n = 25,有X = 50和S = 8。
12、形成的置信度是95%的置信区间nd.f. = n 1 = 24, 所以置信区间是 Chap 8-33t分布的置信区间例子n解释这个区间需要假定总体接近于一个正态分布(尤其是因为n仅仅是25)。n这个条件可以通过生成如下形式来进行核查:n正态概率图n盒形图(续)Chap 8-34置信区间总体均值总体均值 未知未知置信区间置信区间总体比例总体比例 已知已知Chap 8-35总体比例置信区间,n总体比例( )的区间估计可以通过对样本比例( p )的不确定性增加一个限制来计算。Chap 8-36总体比例置信区间,n回忆一下样本比例,如果样本容量足够大,其分布将接近正态分布,有标准差n我们将通过样本数据
13、估计如下形式:(续)np)p(1n)(1pChap 8-37置信区间端点n置信区间上下界通过以下公式来计算n其中 nZ/2 是所要求的置信度的标准正态值np 是样本比例nn 是样本容量n注意:一定要 np 5 和n(1-p) 5np)p(1/2ZpChap 8-38例子n一个100人的随机样本有25个人是左撇子n生成一个左撇子的真实比例,具有置信度是95%的置信区间Chap 8-39例子n一个100人的随机样本有25个人是左撇子。生成一个左撇子的真实比例,具有置信度是95%的置信区间。 /1000.25(0.75)1.9625/100p)/np(1/2Zp0.3349 0.1651 (0.04
14、33) 1.96 0.25 (续)Chap 8-40解释n我们有95%的把握确信在总体中左撇子的比例在16.51% 和 33.49%之间 n尽管区间0.16510.3349有可能包含也有可能不包含真实的比例,但是对于这100个样本用此种方法生成的区间95%包含真实比例。Chap 8-41样本容量的确定均值均值样本容量样本容量的确定的确定比例比例Chap 8-42抽样误差n样本容量需要达到置信度(1 - )要求下的误差界限(e)n此误差界限也称为抽样误差n总体参数估计时的不精确量n点估计生成置信区间时增加减少的量Chap 8-43样本容量的确定均值均值样本容量样本容量的确定的确定n2/ZX n2
15、/Ze 抽样误差 (误差界限)Chap 8-44样本容量的确定均值均值样本容量的确定n2/Ze (续)2222/eZn求解n得到Chap 8-45样本容量的确定n为了确定均值所需的样本容量,必须知道:n目标置信度 (1 - ),其决定了关键值 Z/2n可接受的抽样误差 en标准差 (续)Chap 8-46求样本容量的例子如果 = 45,在90%的置信度下均值5的估计所需的样本容量要多大? (取整)219.195(45)(1.645)eZn222222所以目标样本容量 n = 220Chap 8-47如果未知n如果是未知的,其可以通过目标样本容量的公式来进行估计n使用的值应期望至少与真实的值一样
16、大n选择一个试验样本并通过样本标准差S来估计Chap 8-48样本容量的确定样本容量样本容量的确定的确定比例比例22e)(1Zn求解n得到n)(1Ze(续)Chap 8-49样本容量的确定n为了确定比例的目标样本容量,必须知道:n目标置信度 (1 - ),其决定了关键值 Z/2n可接受的抽样误差 en真实的总体比例 n可以通过一个试验样本来估计 (或者谨慎的使用0.5来估计)(续)Chap 8-50求样本容量的例子在95%的置信度下, 多大的样本可以估计真实比例,且其总体误差在3%以内? (假定一个试验样本p = 0.12)Chap 8-51求样本容量的例子解:对于95%的置信度, Z/2 = 1.96e = 0.03p = 0.12,用此估计故 n = 451450.742(0.03)0.12)(0.12)(12(1.96)2e)(12/2Zn(续)Chap 8-52道德问题n当研究一个点估计时,置信区间估计(反映抽样误差)也将进行研究n置信度总是将被提到n样本容量将被提到n置信区间估计的解释也将被提供Chap 8-53小结n介绍置信区间的概念n讨论点估计n置信区间的估计n均值的置信