漫谈统计之抽样分布

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。
发布评论
全部评论
段落信息
现在我们进入到推断统计学的范畴,也就是说我们需要用样本去推断总体。但是有的同学会问了,我用样本为什么能推断总体呢,这需要解决一个理论问题,就是需要知道抽样分布。那么什么叫抽样分布呢,抽样分布实际上是建立样本到总体的一个理论上的桥梁,它的准确定义是这样的,是从一个总体当中随机抽取容量相同的样本,然后用这些样本计算出某些统计量的取值,根据这些统计量所有可能取值的概率分布,我们就叫它的统计量的抽样分布。这概念比较抽象,我们举一个例子,你比如说一个老师在上课之前,他需要了解上节课学生掌握的知识的程度如何,需要课前提问,那么课前提问的时候,他不可能把所有的学生都提问一遍,如果这样的话一节课全部都用来提问,还不一定够。所以对于一个100人的课堂,那么他可能抽10个人或者5恩个人。那么我如果这个10个人和5个人作为样本,他的一种回答的状况,如果能够摸清楚它的分布,我就能够推断出总体的分布状况。那么讲回答状况还是比较抽象,那么你要比方平均身高的话,更容易理解一些,100个人当中我抽10个人,他的平均身高,那么这10个人的平均身高,可能这10个人都是抽的是高同学的,也可能都是抽出来矮的同学,但是大多数情况下可能是高矮都有。因此我们需要算出来,这个被抽样这些同学平均身高的一个概率分布,这个就叫做抽样分布,如果它的规律我们比较清楚的话,我们就可以用来推断总体。 那么我们研究抽样分布的时候,实际上是具体的根据统计量来算的,一般是我们研究样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。那么样本均值的抽样分布,也就是说我们需要从容量相同的所有可能样本当中,算样本均值的概率分布。比如说我们从4个总体当中抽取2个元素,这4个总体分别取值是1、2、3、4,那么它的均值,它总体就均匀分布,它的均值是2.5,方差是1.25。那么我们如果从4个当中抽2个,如果是重复抽样的话,它的可能写,所有可能抽样的种类就是4的平方16个,我们把这16种结果,把它的样本均值都算出来,我们发现,把它画成直方图,发现它是一个正态分布,而且这些样本均值的期望和总体的均值都是一样的2.5,而样本的方差算出来是0.625,而总体方差是1.25,不一样,有什么关系呢,细心的同学就会发现,它刚好是总体方差的1/N。 这是一个例子,如果我们去做实验,比如说我们可以拿出硬币1分的、2分的、5分的、1毛钱,那么你可以对它进行随机抽样,你可以做大量的实践,我们都会发现有这样一个规律,就是样本均值的期望,等于总体的均值,而样本均值的方差却等于总体方差的1/N。当然这个结论,除了从现实当中进行总结之外,统计学家也有过严格的数学证明。因此给出了我们的第一个定理,说若总体服从率正态分布,那么样本均值它也服从正态分布,它的均值是总体的期望,它的方差是总体方差的1/N,那么这个正态分布,我们做一个标准化,就样本均值减去总体均值再除上样本均值的标准差,就会服从于标准正态分布。

全文文稿

收藏说明: