漫谈统计之统计与统计学的应用(上)

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
通过对于《红楼梦》的具体研究方法和存在的问题,通过数列,分析来引发统计学在社会工作生活中的运用。还有就是利用统计学中的实证分析方法,预测危机,降低危害。另外,西方总统选举等政界中运用也非常广泛。通过对于选民的抽选预算,进而把自己的利益最大化,减少损失。同时,在经济学中有哪些重要的意义进行了详细的举例说明。
发布评论
全部评论
段落信息
我们知道红楼梦是中国古典四大名著之一,在市面上流传的版本大概是120回,那么在这120回当中,在市面所流行的观点,前80回是曹雪芹所写,后40回为高鹗所写,从红学的研究来说,红楼梦的版本可能有其他的说法,其中有一种说法,就是红楼梦可能不是120回,而是108回,当然这是非主流的说法。那么两种观点哪一个是正确,哪一个是错误的呢,还有待于进一步的证实。统计学为红学的研究,提供了一个思路。在1985年复旦大学李贤平教授,曾经做了一个研究,他利用统计学的方法,将120回看作120个样本,然后确定与情节无关的虚词作为变量,我们都知道,小说在写作过程当中,相互抄袭的现象非常严重,但是有关的写作的风格和手法,不同人之间是不容易抄袭的。所以这个李教授就利用了写作的风格和手法作为变量进行研究,利用所学的虚词,那么我们日常生活当中,很多人有口头禅,那么这个口头禅,实际上就是不同人说的风格。那么作家他的写作风格,就可以利用虚词,像连接词、感叹词、之乎者也之类出现频率的多少,来判别这个作家的写作风格。因此李教授就利用多元统计的方法,将120回的样本进行聚类分析,在这里聚类分析是指统计学当中的多元统计当中的一种重要的方法,在以后我们会介绍。那么研究的结果是什么呢,结果发现,在120回当中利用聚类分析,发现确实这本书分成两部分,那么证明了这本书确实为两个作家所写。但是是不是前80回就是曹雪芹所写,后40回就是高鹗所写,那么大家想一想,接下来我们应该怎么研究。 那么有些同学会想到了,我们可以找曹雪芹同时代的其他作品做聚类分析,然后与我们红楼梦的前80回进行对比,来判别到底是否是曹雪芹所写,后40回也可以如法炮制。那么经过研究发现,前80回的写作风格与曹雪芹的同时代的作品,确实是同一类,从而证明了红楼梦前80回确实是曹雪芹所写,而后40回结果发现与高鹗同时期的作品写作风格差异非常大,从而推翻了市面上主流说法,后40回为高鹗所写的主流说法,这一结论在当时引起了极大的轰动,这就是我们统计学在红学研究当中一个很重要的应用。那么另外我们可以再说一说,红楼梦研究的其他的问题,当时红楼梦据说在宫廷当中,写作的时候流传非常广泛,那么宫廷,尤其像皇族看到红楼梦这本书的时候觉得非常好,当时印刷条件非常简陋,因此流传出来的书本基本上是手抄本,由于在皇族对于红楼梦的写作过程当中非常欣赏,因此这本书逐渐的也被流传开了。但是我们知道,曹雪芹他是一个没落的贵族,因此他在写作的过程当中,就对于当时的一些时弊进行了猛烈抨击。在往后写作过程当中,这种碰击之间的非常直观、非常露骨,对于当时的统治阶级造成了非常大的冲击,因此当时的皇族就把红楼梦后边一部分,进行了焚毁,然后利用在找类似的文人,把后面的部分进行改写、纂写,就形成了我们现在的版本。因此另外一个主流的说法,红楼梦不是120回,是108回,当然这些观点,还有待与我们统计学的进一步的证明。那么通过这个实例我们就可以知道,我们红学它属于文学的研究范畴,统计学是一种工具的研究方法,在这个过程当中,两者进行了结合,解决了一个非常重大的问题。

全文文稿

收藏说明: