指标 C19 C20 C21 C22 C23 C29 C30 C31 C33 C34 C35 C36 值 0.14 0.50 2.00 1.00 2.00 -0.31 -0.22 4.00 0.23 0.00 0.50 0.22 变换后,再次用非参数检验中的1-Sample K-S 检验,发现 Asymp.Sig.(2-tailed)值显 著变大,其中部分指标的值如下表2.3: 115 表2.3 变换后的1-Sample K-S 检验结果 指 标 C1 C2 C3 C4 C5 C6 C7 C10 C13 C14 C15 C16 C17 Sig 值 0.787 0.590 0.996 0.907 0.997 0.890 0.199 0.179 0.982 0.905 0.765 0.935 0.979 指 标 C19 C20 C21 C22 C23 C28 C29 C30 C33 C34 C35 C36 Sig 值 0.922 0.616 0.370 0.786 0.645 0.051 0.997 0.698 0.615 0.985 0.365 0.266 与第一次相比有了很大的改进,由此经过数据预处理使绝大多数指标满足了正态分布的 要求,而部分指标数据中由于有较多负数,无法用Box-Cox 变换使之变换到正态,在后面 的指标选择和进一步分析中后再进行处理。 2.3 建立多元统计分析模型 120 人们常把1928 年维夏特分布的导出作为多元分析成为一个独立学科的标志。20 世纪30 年代,R.A.费希尔、H.霍特林、许宝以及S.N.罗伊等人作出了一系列奠基性的工作,使多元 统计分析在理论上得到了迅速的进展[3]。 多元统计分析重在研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性, 它的重要基础之一是多元正态分析。 如果每个个体有多个观测数据,或者从数学上说, 如 125 果个体的观测数据能表示为 P 维欧几里得空间的点,那么这样的数据叫做多元数据,而分析 多元数据的统计方法就叫做多元统计分析 。本文基于SPSS19.0 软件进行多元统计分析。 2.3.1 因子分析——主成分分析模型的构建 (1)基本原理 综合因子分析、主成分分析的特点,首先通过因子分析法将 N 项指标分为m 组,每 130 组包括几项原始指标,这样使得每组指标组内高度相关,而组间的相关性很弱。同时以每个 因子的方差贡献率占所选定因子的总方差贡献率的比率对该指标子集自然赋权。 其次从各指标子集出发,求取每一样品在对应子集的主成分数值。若有k 个子集,记为 k Y ,Y , ,Y 1 2 L ,则第i 个样品的k 个主成分可以表示为( ), ( ), , ( )。1 2 k P Y P Y L P Y (2) 因子分析——主成分分析模型 通过上面两步,可以得到综合评价模型: = ( ) + + ( ) Y1 1 Y k F α P Y α P Y K 135 L 即综合得分是每个指标子集的自然权数与其主成分数值乘积之和。这样运用多元统计方 法将这些指标所包含的信息进行加工挖掘而得到了一个综合评价值,然后通过综合得分可以 来比较和判断不同股票的投资价值。 这是一个综合得分,将反映股票信息的多方面指标(财务、非财务等)浓缩为一个数字, 140 在一个板块中是相对数,为进行综合分析股票提供了信息。综合得分高的一般说来投资价值 大。 (3)因子分析——主成分析法的优点 因子分析——主成分分析法的优点[4]比较显著,这主要表现在一是利用了主成分分析中 第一主成分的综合作用,便于综合评价模型的解释;二是借用因子分析方法通过正交旋转对 145 变量进行分组,构造评价体系结构,并且每个变量指标都包含在内,保证了评价体系的完备 性;三是在建立的综合评价模型中,每个指标及对应的权重都很明确,便于实际应用。当对 变量进行分组以后,如某一组内变量指标较多,其第一主成分(综合主成分)的贡献率达不 到要求时,可在该组内再进行分组,直到第一主成分具有代表性为止。这样就构成了多层次 分组主成分综合评价模型。 150 2.3.2 实证分析 (1)Kaiser 抽样适合性指数和 Bartlett 球面性检验 经数据预处理后,在进行因子分析前需要做 Kaiser 抽样适合性指数和Bartlett 球面性 检验(KMO and Bartlett's Test)。Kaiser(1970,1974)提出抽样适合性指数(Kaiser-Meyer-Olkin Measure of Sampling Adequacy,简称KMO 或 MSA)作为判断变量间相关系数是否适合做 155 因子分析的标准。KMO 是取样适当性指标,当 KMO 值愈大时,表示变量间共同的因素愈 多,愈适合进行因子分析。Bartlet(t 1951)提出一种针对变量间相关矩阵的球面检验方法(Test of Sphericity),此检验分布与卡方分布接近,其零假设是相关系数矩阵是一个单位矩阵。 进行检测结果如下表2.4: 160 表2.4 KMO and Bartlett’s Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy 0.650 Approx. Chi-Square 4207.968 Bartlett's Test of Sphericity df 0.666 Sig. 0.000 检验结果显示KMO 值为0.650,表明适合进行因子分析。而球形检验的卡方统计量显 著小于 0.01,即相关系数矩阵不是一个单位矩阵,原始变量间有共同因素存在,也表明适 合使用因子分析方法。 165 (2)因子分析 首先,根据特征值大于1 以及累积方差贡献率确定因子个数。在自然科学的研究中,决 定保留的因子所能解释的变异量以能达到95%为宜,社会科学研究则以达到60%为宜。由 表2.5 可以看出,前 11 个因子的特征值都大于1,累积方差贡献率为77.364%,故认为对 因子的提取结果比较理想。 170 表2.5 Total Variance Explained(总方差分解表) Component Initial Eigenvalues Total % of Variance % of Variance 1 7.388 19.968 19.968 2 4.691 12.679 32.647 3 3.132 8.465 41.112 4 2.542 6.871 47.984 5 2.262 6.112 54.096 6 1.886 5.096 59.193 7 1.660 4.487 63.679 8 1.463 3.954 67.633 9 1.339 3.618 71.251 10 1.186 3.206 74.457 11 1.076 2.907 77.364 Extraction Method: Principal Component Analysis 再进行因子旋转。采用主成分法计算的因子载荷矩阵可以说明各主因子在各变量上的载 175 荷,即影响程度。但为了使载荷矩阵中系数向0-1 分化,对初始因子载荷矩阵进行方差最大 旋转,得旋转后的因子载荷矩阵。 根据旋转后的因子载荷矩阵,可以考察各主因子的经济含义以及其与内部主要指标间的 数量关系,如表2.6 所示: 180 185 190 表2.6 因子构成及命名 公共因子 指标 因子命名 因子 权重 1 资产利润率、总资产收益率、净资产收益率、销售净利润率、每股 收益、主营业务鲜明度 盈利性因子 0.258 2 总资产、总股本、主营业务收入、净利润 规模型因子 0.164 3 总资产周转率、净资产周转率、毛利率 经营性因子 0.109 4 每股净资产、每股公积金、第一大股东比例、每股未分配利润、股 票价格波动率 效益性因子 0.089 5 总资产增长率、净资产增长率、流通股比例 扩张性因子 0.079 6 资产负债率、流动比率、长期资产适合率 财务杠杆因子 0.066 7 经营现金流与负债比、净利润现金含量、主营业务收入增长率、每 股现金流 现金流因子 0.058 8 技术及研发人员占员工数比例、大专及以上学历员工占总员工比例投入性因子 0.051 9 资产利润率、总资产收益率、净资产收益率、销售净利润率、每股 收益、主营业务鲜明度 盈利性因子 0.047 10 总资产、总股本、主营业务收入、净利润 规模型因子 0.041 11 总资产周转率、净资产周转率、毛利率 经营性因子 0.038 总计 1 (3)主成分分析 首先求出每个因子的主成分,然后用因子权重系数分别加权就可以求出最后的结果。 195 对因子1 进行主成分分析,基于SPSS 过程取特征根大于1 和累积贡献率确定主成分个 数为1 个,并且根据因子分解得到主成分矩阵: 表2.7 Total Variance Explained(总方差分解表) Component Initial Eigenvalues Total % of Variance % of Variance 1 4.730 78.840 78.840 Extraction Method: Principal Component Analysis 200 表2.8 Component Matrix Component Component 1 1 资产利润率C5 0.960 销售净利润率C19 0.856 总资产收益率C17 0.963 每股收益C1 0.864 净资产收益率C18 0.896 主营业务鲜明度C36 -0.775 Extraction Method: Principal Component Analysis 经过变化可以得到主成分系数矩阵和主成分表达式。其中变换为: 因子1/ 4.730。1 P = 205 表2.9 因子1 的主成分系数矩阵 Component Component P1 P1 资产利润率C5 0.441 销售净利润率C19 0.394 总资产收益率C17 0.443 每股收益C1 0.397 净资产收益率C18 0.412 主营业务鲜明度C36 -0.356 因子1 的第i 个主成分的表达式为: ( 1, , ) 1 1 P Y P i n i = i = L ,每个主成分的方差贡献率 Σ= = n i i i i 1 α λ / λ (n 为主成分个数)作权数,从而构造综合评价函数。其中 Y = (C5,C17,C18,C19,C1,C36) 1 ,主成分权重1 1 210 α = 。 同理可以得到其它因子的主成分的表达式。 对因子2 进行主成分分析,根据特征根大于1 的规则和累积贡献率确定主成分个数为1 个,其表达式为: 2 2 1 P Y P i = ,特征值为3.355,其主成分系数矩阵为: 215 表2.10 因子2 的主成分系数矩阵 Component Component P1 P1 总资产C30 0.524 主营业务收入C3 0.498 总股本C29 0.491 净利润C4 -0.485 Y = (C30,C29,C3,C4) 2 ,主成分权重= 1 2 α 。 对因子3 进行主成分分析,根据特征根大于1 的规则和累积贡献率确定主成分个数为1 个,其表达式为: 3 3 1 P = Y P i ,特征值为2.226,其主成分系数矩阵为: 220 表2.11 因子3 的主成分系数矩阵 Component Component P1 P1 总资产周转率C13 0.602 主营业务收入C20 -0.495 净资产周转率C14 0.627 Y = (C13,C14,C20) 3 ,主成分权重= 1 3 α 。 对因子4 进行主成分分析,第一个因子特征值大于1,但累积方差贡献率仅为49.769%, 225 而第个因子特征值0.911 接近于1,前2 个因子的累积贡献率能达67.995%,因此对因子4 提取2 个主成分,其表达式为: 4 4 1 4 2 P = Y P +Y P i ,主成分的特征值分别为2.488 和0.911, 其主成分系数矩阵为: 表2.12 因子4 的主成分系数矩阵 Component Component P1 P2 P1 P2 每股净资产C2 0.596 0.232 每股未分配利润 C7 0.483 -0.217 每股公积金C6 0.448 0.608 股票价格波动率 C37 -0.342 0.299 第一大股东比例 C32 -0.306 0.664 230 Y = (C2,C6,C32,C7,C37) 4 ,主成分权重= (0.732,0268) 4 α 。 对因子5 进行主成分分析,根据特征根大于1 的规则和累积贡献率确定主成分个数为1 个,其表达式为: 5 5 1 P = Y P i ,特征值为1.914,其主成分系数矩阵为: 学术论文网Tag:代写论文 代写代发论文 代发论文 职称论文发表 |