漫谈统计之数据的收集

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
数据收集的方式包括统计报表型收集,政府及大型企业中应用居多;全面调查和抽样调查。目前这类数据收集方式应用较广泛,成本也比较小,即从总量中提取小部分作为样本,分为随机抽样和非随机抽样二种。
发布评论
全部评论
段落信息
实际上统计学是来自于实际问题的需求,然后根据实际问题进行数据的收集、整理、分析和解释,最后回到实际的问题当中,对问题进行解释。那么数据收集的方式有哪些呢?我们都知道数据分析有在以往有统计报告、有下级一层一层的往上报,这在计划经济时代用的比较多,当然现在在一些政府部门、大型企业当中也有应用。第二种方式是全面调查,比如说人口的普查,人口普查我们国家每十年进行一次,为什么间隔时间这么长呢?主要是因为普查所需要的人力物力时间成本非常巨大,因此只有少部分比如说经济普查才会采用,绝大部分的企业、个人是无法采用普查的方式的。第三种方式就是抽样调查,抽样调查它实际上是应用极其广泛,因为抽样调查就是从大量的总体中抽出一部分样本对总体进行推断的过程,它的成本比较小,效率比较高,因此应用范围比较广泛。 那么什么是抽样调查呢?抽样调查实际上我们刚才讲了,就是从总体当中抽取具有代表性的样本,对总体进行推断的一个过程。因此抽样调查我们又分为随机抽样和非随机抽样,随机抽样又叫做概率抽样,非随机抽样又叫做非概率抽样。那么我们现在问这样一个问题,街头拦街访问是不是随机的呢?那我们可以看出一些记者为了采访一些问题,在街头随便遇到一个人就问这问那,然后问到一部分人,然后把这材料汇总上来然后进行报。那我们就问了,这种方式是不是随机的?这就涉及到随机的一个定义,什么叫随机呢?随机实际上包含两个特征,第一机会均等,第二结果未知。那么我们按照这两个标准来衡量刚才我们说的街头拦街访问到底是不是随机的?第二个条件结果为止,肯定是满足的,在访问之前我们不知道结果。那么是不是机会均等呢?同学们可以想一想,看上去并不是机会均等,为什么呢?因为如果我们在上班时间去采访行人,那么那些家庭主妇,那些老弱病残的人他可能就不会在街头,这部分人肯定就没有机会被采访到,如果我们在闲暇时间去采访,那么那些上班族可能出现的概率就比较少,因此他们的机会并不是相等的,因此从这个角度来说,街头拦街访问并不是随机而是随便和随意。 因此随机抽样一定要保证随机性,有了随机性才会有样本的代表性,有了样本的代表性推断总体才会可靠和准确。 那么我们进行调查、抽样调查应该考虑哪些问题呢?主要考虑两大问题,第一个就是误差问题,第二是成本问题。调查的目标我们应该是成本尽可能的低,而调查的精度尽可能的高。那么如何去提高调查的精度呢?同学们想一想,有的同学说了我可以扩大样本容量,调查的容量越多,当然我的精度就会越高,但是不是这样呢?也未必,比如说我们前面讲的美国总统选举当中,罗斯福的预测过程当中,一个小的公司,他就能非常小的容量却预测非常准,而一个大的容量预测却不准,因此扩大样本容量只是其中的可能会提高它的精度,但也不一定。另外一种提高调查精度的方法改变抽样的方法,就是要在抽样的方法上多下工夫,才能让它的精度提高。

全文文稿

收藏说明: