漫谈统计之回归分析(下)

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
在实际工作中,进行统计分析时,相关与回归分析是经常使用的手段。通过相关关系的判断、运用相关与回归分析建立数学模型,可以利用模型对数据进行预测,再利用估计标准误差对预测结果进行确认。相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。
发布评论
全部评论
段落信息
接下来我们看多元回归,多元回归和一元回归的主要区别就在于,多元回归的自变量是多个,而一元回归的自变量是一个。除此之外,它们的推理形式基本上是相似的,那么多元回归的形式,估计出来的方程,在各自的参数上加一个,那么所对应的每个X的前面的系数,我们把它叫做偏回归系数,它表示的是当其他变量不变时,X每变动一个单位,Y的平均变化量。那么对于二元回归来说,我们用一个平面图可以表现出来,它就是在一个平面,样本点落入一个回归面上,它的一个,它这个回归面对于它这个样本嗲的代表性实际上。那么我们实际上对于多元回归的参数进行估计,参数估计是我们仍然仿造一元线性回归的方法,利用最小二乘法,也就是说使得参差的平方和最小,就是说所有点Y到它的估计值外间的离差的平方和最小。然后呢,当然这个时候β值有很多,那么我们对应各自的参差平方和,对于这个偏回归系数求偏导,一阶偏导为0,然后解出相应的方程组,得到相应的系数。 当然这个过程,计算机软件能帮我们完成,我们没有必须进行手工的运算,我们只需要根据计算的结果,能够读懂相应的题就可以了。我们根据上节课讲的一些例子,比如说一家银行它的不良贷款有贷款余额、应收贷款、贷款项目、固定资产投资等项目所解释,那我们就可以把相应的回归系数算出来,算出来能不能直接用,还是不能直接用的,我们需要进行拟合U度的检验,和相关显著性检验,拟合U度检验,我们又分为可决系数检验和估计标准误差检验,跟一元回归有点相似。可决系数我们仍然仿照前面的形式,就是总离差平方和SST,等于残差平方和加上回归平方和,参差平方和是众多X之外的参差所引起的,其他因素所引起的。回归平方和是由于众多X所引起的,它们对应的自由度,总离差平方和的自由度是N减1,N是所有的样本容量,参差平方和自由度是N-K-1,这个K是S的个数,回归平方和的自由度是K,就是自由度的个数。那么我们度量拟合性就是用回归平和放除以自由度,就是SSR除以SST,等于1减参差平方和除以总离差平方和,就是1减SSE除以SST。这种情况下,我们用可决数来考虑拟合系数会发现一个问题,就是当自变量个数增加的时候,这个R会自动增加,为了避免这个问题,统计学家经过研究,对它进行了修正,就是R方本来等于1减SST除上SST,那么在SSE的基础上,除以最后N减K减1,在SST的基础上除以自由度N减1就得到了这个修正的可决系数,所以修正可决系数来说,它比可决系数更加准确的反映出来,线性方程动作X的代表性,拟合程度。 另外呢,我们还可以用回归估计标准误差SE来表示它的拟合程度,SE也叫SY,它是离差平方和除以自由度N减K减1,开根号,也就是说SSE除上N减K减1,开根号,那么它实际上也是一个平均参差的概念,这个平均参差越小,众多样本点到真值的距离就越小,那么它的拟合性就越好。那么估计标准误差是从绝对数的角度来表示拟合性R,可决系数或者修正的可决系数只是从相对数的角度来衡量它的可决系数,可它的拟合程度。那么对于它的拟合性进行检验之外,之后还要对于它的整体方程的回归系数进行检验和单个回归系数进行检验。那么整体方程的检验,我们用的是F的统计量,原假设H0就是所有的β都为0,那么整体方程是不显著的,β假设只有一个不为0,至少有一个不为0,那么它的整体方程不显著,那么它的F统计量就是用SSR除以自由度K,比上SSE比上自由度N减K减1,也就是说MSR比上SSE,就是说回归的均方比上参差均方,得到一个统计量。那么这个统计量,如果大于临界值我们就拒绝H0,拒绝H0就认为整体方程都为0这个条件不成立,那么它至少有一个不为0,那么整体方正是显著的。也就是说如果F大于FR的话,Fα的话,那么就认为整体方程是通过检验的。线方形成就成立,整体方程成立不代表每一个系数它都显著成立,每一个系数的显著性检验,我们设H00βI等于A,β假设是βI不等于0,那么H0成立的认为这个回归系数,对于它没有影响,如果拒绝它说明这个变量对于Y之间有显著性影响,那么它用的统计量是βI的估计值比上βI估计值的标准差,服从自由度为N减K减1的T分布,如果算出来的统计量值大于其临界值,我们就拒绝H0,拒绝H0就认为对应的这个XI,对于Y就产生了显著性的影响。

全文文稿

收藏说明: