漫谈统计之参数估计

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。当估计值的数学期望等于参数真值时,参数估计就是无偏估计。当估计值是数据的线性函数时,参数估计就是线性估计。
发布评论
全部评论
段落信息
参数估计,就是对总体参数的一个估计。我们在日常生活当中我们根据经验,比如说这个人穿的什么衣服,言谈举止如何。我们就能大致判断出他的身份。 比如说这个人满身都是泥,都是灰尘,一般都是在一个环境比较恶劣,或者体力劳动者。这个人比较粗俗,那他肯定没有受过很好的教育。我们也可以根据他的脸色和心情猜测他的身体状况,脸色非常难看,或者心情不好,或者生病了。 我们统计当中估计也是这样的,当然是通过数据估计出来的,更加科学。因此参数估计的基本过程,就是通过样本获取一些基本的统计量,然后通过一些样本的统计量与总体参数之间的桥梁,我们前面所学的抽样分布,来估计出总体的参数。 比如说我们某一个地区婴儿的体重服从一个正态分布,我想估计一下这个地区的婴儿平均体重和方差标准差,我就可以抽样,随机抽出一百个婴儿,得到相对应的数据,我们根据这一百个婴儿的数据,我们利用相应的抽样分布,我们可以估计出它的均值和方差,和标准差,这个具体细节我们到后面来讲。 参数估计我们分为点估计,区间估计两种。点估计就是用样本的统计量来估计总体参数的一个定值。区间估计就是用样本统计量的分布,来估计总体参数的一个随机区间。 你比如说两个篮球队或者足球队进行对抗赛,之前都要估计对方的平均身高,如果估计出来他的身高是一米六八,这是点估计。如果估计出来身高是一米五七到一米八四之间,这是区间估计。当然这么矮的不可能在打篮球了,打篮球不太合适。 我们现在想一下,如果我们估计总体参数,这个估计量应该由哪些作为总体参数比较合适? 换句话说,我们用一个什么样的估计量才算一个好的估计量,好的估计量的标准是什么?就跟我们择偶的标准是一样的,有几个标准,我们统计量的标准也是有几个好的标准,主要有无偏性、有效性和一致性。所谓无偏性,就是指估计量的抽样分布的数学期望等于估计的总体参数,你在一次抽样过程当中,可能和总体参数均值不一样,那么如果我抽样的次数足够多,它的期望值应该等于总体参数。如果不一样的话,就是有问题的。 比如说我们看打枪射击比赛,还有射箭,你一次没有打到靶心,可以理解,两次,你总体上应该在这个靶心周围,你不能打到这个靶子上,你打到别人的靶子上,这里是偏了,你肯定是不能容忍的。 如果满足了无偏性,大家都是无偏的,哪一个更好?我们就要保住有效性,所谓的有效性就是说,当两个都是无偏估计量的时候,应该选更小标准差的估计量,就是说你的标准差越小,你波动的范围越窄,越集中,越有效。 第三个标准叫做一致性。随着样本容量的增大,样本估计值会越来越接近于总体的参数。当然有些人说,这肯定是这样的,实际上有些规章并不满足这个情况,比如说我们前面讲的盖洛普公司用两千份样本容量进行估计,而另外一个杂志社用了一千万份估计,这个大量容量未必能够接近于总体的真实情况,小的容量却接近准确。 因此只有满足一致性的情况下,样本容量越大的时候,接近总体参数的情况下,这个估计量才算比较好的估计量。 所以我们在选用估计量的时候应该满足这三条性质。无偏性,有效性和一致性。我们用点估计来估计的时候,虽然能够直观的估计它的估计值,但是没有给出估计量的有效程度,我们刚说了,一个好的估计量应该满足三个性质,无偏性、有效性和一致性。那么作为点估计值来说,直接估计总体的参数,给出一个具体的值,比较直观,比较简单,但是有一个弱点,没有给出估计值接近总体参数的一个可靠的程度,你到底准确不准确,准确性有多大,不知道。你比如说我估计这个人的年龄是二十五岁,那么这二十五岁到底可靠性多大?不清楚。所以我们需要借助区间估计,就是说在点估计的基础上,给出总体参数的一个区间范围,这个区间是由样本统计量加减一个抽样误差得到,那么这个抽样误差实际上给出了一个接近于总体参数的一个度量,区间估计我们置信上限,置信下限,它的点估计我们做中间值。

全文文稿

收藏说明: