漫谈统计之因子分析

讲师风采
吴庆军
副教授
讲师简介:
曲阜师范大学管理学院副教授
视频简介:
因子分析是统计学中数据简化的技术,研究数据间的内部关系,探索基本结构,用少数假想变量,能够反应众多变量的信息。其中原始变量是可观测的显象变量,而因子分析是不可观测的潜在变量。因子分析是比较抽象的概念,实际运用中需要构造因子模型。
发布评论
全部评论
段落信息
因子分析和主成分分析有相关之处,它也是一种数据简化的技术,它通过研究众多变量之间的内部关系,探测数据的基本结构,用少数假象变量来表示基本的数据结构。这个几个假象的数据变量,能够反映原来众多变量的信息,原始的变量是可以观测的显在变量,而假象的变量,是不可观测的潜在变量,称为因子。所以因子分析和组成分析有相同之处也有不同之处。比如说我们对于一个商店的测量指标有很多,但消费者关心的可能有三个方面,一个是商店的环境,一个是商店的服务,和商品的价格,因子分析可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的3个潜在的因子。对于商店进行综合评价。那么这3个公共因子可以标识为XI=A1IF1+A2IF2+A3IF3+ε1,那么F1、F2、F3成为不可观测的潜在因子,24个共享这3个因子,但是每一个变量又有自己独特的个性,不被不包含的部分用ε,特殊因子所表示。 因子分析和回归分析不同,因子分析的因子是一个比较抽象的概念,而回归分析的因子是非常明确的实际意义,主成分分析和因子分析也有不同,主成分分析分析的仅仅是变量的变换,而因子分析需要构造因子模型,主成分分析原始变量的线性组合,表示新的综合变量,既主成分。而因子分析潜在的假象变量和随机影响变量的线性组合,表示原始变量。那么因子分析的模型,我们刚刚说了用XI=A1IF1+A2IF2+A3IF3+ε1,M是小于P的,它们的系数称为因子载荷,ε称为特殊因子是不能被M个公共因子所包含的部分,那么因子载荷的AI是第I个变量与第J个公共因子的相关系数,那么载荷矩阵当中第I行和第J列的元素,反映了第I个变量与第J个公共因子的相关的重要程度,绝对值越大,它的相关的密切程度就越高。那么变量的共同度是什么意思,变量XI的共同度是因子载荷矩阵的第I个行的元素的平方和,那么它的统计意义,就是所有的公共因子和特殊因子对于变量XI的贡献都为1,如果这个共同度非常靠近的接近于1,那么因子分析的效果就比较好,从原始空间转化为公共因子空间的转化性质就非常好。 那么因子载荷矩阵的方法,我们可以借助主成分分析的方法,所对应的标准化特征向量,那么我们作为转化之后我们还要经过因子的旋转,那么为什么要经过因子的旋转呢,因为建立因子数学模型的目的,不仅仅是要找出公共因子对于变量的分组,更重要的是要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清楚,则不便于对于实际的背景进行解释。由于因子载荷并不是唯一的,所以应该对于因子载荷进行旋转,其目的使得因子载荷结构简化,使得载荷矩阵每行每列的因素的平方和向0和9两极分化,有4种主要的方法,有阵交旋转法、最大4次方最大法、方差最大法和等量最大法。那么因子旋转的最常用的方法是方差最大法,方差最大法是从简化因子载荷矩阵的每一列出发,使每个因子有关的载荷的平方和方差最大,当只有少数几个变量在某个因子上有较高的载荷时,对于因子的解释最简单,方差最大的直观含义,就是希望通过因子旋转后,使得每个因子的载荷尽量的拉开距离,一部分载荷趋近于正负1,而另外一部分载荷趋近于0。 那么我们实际上它的旋转矩阵,那么在因子分析当中有一个因子得分的概念,我们知道,我们前面主要解决了用共因子的线性组合来表示一组观测变量的有关问题,但是如果我们要使用这些因子做其他研究,比如说得到了因子作为自变量作为回归分析,对于样本进行分类和评价,这就需要对于因子共因子进行测度,既给出共因子的值。因子分析的数学模型XI=A1IF1+A2IF2+A3IF3+ε1,M是小于P,那么原来的变量被称为共因子的线性组合,当载荷矩阵旋转之后,共因子可以作出解释,在通常的情况下,我们还想反过来把公共因子表示为原来变量的线性组合。那么这时候可见我们要求得到每个因子的得分,必须得到得分分数函数的系数,由于P大于M,所以不能得到精确的得分,只能通过估计。

全文文稿

收藏说明: