产生的影响,差异性检验结果也不显著。 7 对负号的说明:由于这里的高考分数是“线差处理”后的高考分数,负数代表该考生的高考成绩比当地 的一本录取线低。并且在样本的处理中,我们已经去除了远远低于其他考生分数的极端样本。因此负数的 存在是合理的。 在全国样本中我们对于假设1 进行了检验,那么在具体省份中的结果又会是怎样呢?为 195 了更直观地体现分数的差异且尽可能排除其他因素的影响,我们选取了该高校在四川省录取 的考生作为样本(样本量为1442,为样本量最大的省份)。这样首先排除了高考分数在全 国范围内作为受教育成果代理变量时的非精确性。其次,只使用四川省的考生作为样本,排 除了中国东西部经济发展差异、教育资源分配不均等因素的影响。我们使用原始的高考成绩 作为样本数据,表3 分别给出了四川省不同城乡属性的考生高考成绩的描述性统计结果。 200 表3 该高校录取的四川省考生高考分数的描述性统计结果 考生类别 差异性检验 变量 农村(579 人) 城镇(863 人) 平均值 541.2 541.1 0.9145 中位数 544 543 0.7979 最大值 588 600 - 最小值 498 499 - 标准误 18.91 20.42 - 偏度 -0.15 -0.014 - 峰度 2.15 2.28 - 注:***代表在1%的水平上显著,**代表在5%的水平上显著,*代表在10%的水平上显著。在差异性检验 中,平均值的检验使用的是t 检验,中位数使用的是Wilcoxon 检验。这里使用的高考分数为原始高考分数。 我们发现,对于四川省考生,农村考生和城镇考生的高考分数在平均分和中位数上相近, 205 数据的分布情况也相似,并且平均值农村考生还要高一些,这似乎与我们的假设相反。但是 通过差异性检验我们发现平均值和中位数的差异性并不显著,即描述性统计中考生的城乡差 异并不能够很好地解释高考分数的差异,这可能是由于还有其他影响考生高考分数的因素尚 未分离出来,导致了结果的不显著。关于假设1 的进一步检验,我们将在后面控制更多的因 素,在考生的受教育成果与城乡类别的多变量回归中进行验证。 210 3.4 热门学院考生的城乡属性分析 更为重要的是,社会资源和信息获取上的差异主要反映在专业的选择上,为此我们对学 院热度和城乡属性进行两个维度的分析。为了考察学院间热门程度的差异,我们对学院进行 分类,以“线差处理”后的分数(表4 中的“平均分差”)来衡量学院的热门程度。“平均 分差”越高的学院,表示报考竞争程度越大,我们定义为“热度”越高,在表4 中以数字 215 14 到1 来表示,数字越大代表“热度”越高。此外,我们在表4 中还列出了每一个学院中 2009 级新生的城镇、农村考生比例,MINUS 为该学院录取学生中城镇考生占总数的比例减 去农村考生占总数的比例。在此模型中,我们的样本为该高校在全国招生的所有省份的考生, 样本量为4452 个。 220 225 230 表4 热门学院的考生来源比例 热度 学院 平均分差 城镇 农村 MINUS 14 通信与信息工程 58.67 65.28% 34.40% 30.88% 13 微电子与固体电子 51.21 60.92% 38.56% 22.36% 12 电子信息工程 43.90 63.25% 36.34% 26.91% 11 经济与管理 41.43 70.19% 29.81% 40.38% 10 光电信息 37.55 62.18% 37.12% 25.06% 9 机械电子工程 33.71 41.32% 57.76% -16.44% 8 物理电子 33.39 51.26% 47.48% 3.78% 7 信息与软件工程 32.34 67.07% 32.93% 34.13% 6 数学科学 32.32 59.85% 40.15% 19.71% 5 计算机科学与工程 31.57 65.49% 33.41% 32.08% 4 自动化工程 21.95 59.22% 39.48% 19.74% 3 政治与公共管理 14.42 61.41% 36.41% 25.00% 2 生命科学与技术 7.98 64.71% 33.99% 30.72% 1 外国语 7.14 64.24% 33.77% 30.46% 235 需要说明的是,经济与管理学院存在特殊性,可能农村的理科考生较不理解或认同管理 者的培养目标,所以本科进入经济与管理学院的意愿较低。此外,信息与软件工程学院也具 有特殊性,因为此学院的学费具有成本定价性质,学费远高于其他学院,所以对于一般农村 考生来说,选择该学院的意愿较低。通过对比城市减去农村比例与热度程度,发现通信与信 息工程学院热度最高,同时在人数较多的工科学院中,该学院考生城市与农村比例差也最高。 240 这似乎有力地支持了我们的假设,但当我们以热度为被解释变量,MINUS 为解释变量进行 分析时,发现MINUS 的回归系数并不显著(P 值大于0.8),说明如果不加入其它控制因素 的话,考生来源的不同与其进入什么热度的学院不存在明显的相关关系。 虽然MINUS 的回归系数不显著,但机械电子工程学院和物理电子学院的MINUS 数据 值得引起我们的注意。其他12 个学院的MINUS 普遍都在30%左右,这与该学校录取考生 245 城乡差别的整体比例差是吻合的。但是机械电子工程学院竟然出现了负号,而且农村考生的 比例超出城镇考生的比例还比较多。考虑到机电的技术性和本科就业性强的特点,可以看出 农村和城镇学生考虑到自身环境情况而在今后道路上做出的选择。并不是说机械电子工程专 业的学生今后就有最好的职业发展,但本科毕业后及时就业可以尽早收回教育成本,为家庭 减轻财政负担,使得机械电子工程专业成为了农村考生的“热门”选择。同时,另一个可能 250 的解释是,农村考生由于社会资源的限制,落榜的压力相较城镇考生更大,为了在高考分数 达到该校录取线的情况下保证可以被录取,更多地选择了“服从分配”,从而这些考生在高 考分数达不到热门学院的情况下,被调剂到了机械电子工程学院。在某种程度上说,这是一 种牺牲长远考虑眼前的策略,体现出了农村考生由于家庭财富的局限性而做出了不利于长期 利益最大化的选择。关于物理电子学院的结果,在我们与物理电子学院的同学的交流中了解 255 到,他们报考这个专业的原因是对于其他院系的领域不甚了解,而物理、电子这两要素却是 高中物理中的重要环节,因此他们选择相对了解一些的专业。与选择机械电子工程学院的原 因相同,另一个可能的解释是农村考生也更多地选择了“服从分配”。这个现象也反映了农 村考生相较城市考生,所掌握的信息是相对匮乏的。 3.5 考生受教育成果与城乡类别的多变量回归 260 进一步,我们以该高校在全国招生的所有省份的考生为样本(样本量为4452 个),在 控制相关变量的基础上,通过多元回归模型(OLS 模型)来检验考生所在省份的发达程度 是否通过影响考生享受教育资源的多少来影响了考生的受教育成果。由于地区差异在方程的 解释变量中有体现,所以我们在这里使用“线差处理”后的高考分数作为样本数据。 SCi=β0+β1LOi+β2D2i +β3D3i +εi (1) 265 其中,SC 表示考生i 的“线差处理”后的分数,反映该生的学习能力。LO 表示考生的 类别的虚拟变量,城镇考生为1,农村考生为0。D2、D3 分别为表示区域的虚拟变量,若 该考生来源于东部8,则D2 取值为1,否则为0;若该考生来源于中部,则D3 取值为1,否 则为0。回归结果见表5。 270 表5影响考生分数及专业选择的多元回归(OLS模型)分析结果 未经怀特调整的回归结果 经过怀特调整的回归结果 Variable t-Statistic Prob. t-Statistic Prob. C 75.43956 0 74.45477 0 LO 1.794545 0.0728 1.852946 0.064 D2 -10.2094 0 -9.590929 0 D3 -1.523663 0.1277 -1.669848 0.095 F-statistic 37.87019*** 37.87019*** Adjusted R-squared 0.024248 0.024248 无交叉项异方差检验 (White Heteroskedasticity Test) F-statistic 51.30446*** 有交叉项异方差检验 (White Heteroskedasticity Test) F-statistic 34.62113*** 注:***代表在1%的水平上显著,**代表在5%的水平上显著,*代表在10%的水平上显著。 从表5 可知,LO 的系数为正并且在10%显著性水平上显著,体现总体显著性的F 检验 在1%水平上显著,并且在异方差检验中没有发现明显的异方差问题。说明在控制了区域经 275 济发展程度不均的影响后,城镇考生的成绩仍然高于农村考生,即城镇考生的受教育成果在 这种情况下要好于农村考生。因此,本文的假设1 得到进一步证实,即农村与城镇教育资源 的不平等会导致学生高考成绩的差异,城镇考生分数会高于农村考生。 同时,比较D2 和D3 的系数,我们可以看到考生地区对考生成绩也有一定的影响。D2 的回归系数为负且在1%的置信水平上显著,说明东部考生的录取分数要明显低于西部考生。 280 综合上述实证结果,我们发现来自于东部发达地区的考生尽管享受了相对优质的教育资源, 也得到了更好的受教育成果,但是却以更低的分数进入高校,加剧了教育的不平等。 为了进一步考察考生类别对专业选择的影响,并且尽可能排除不同区域的经济发展差 异、高考录取比例、对专业的认可程度等因素的影响,我们以该高校在四川省录取的考生为 样本(样本量为1442 个),由于样本为一个省,所以直接以原始高考分数作为样本数据。 285 建立如下二元选择模型(Probit 模型),记为Probit 模型1: 1 0 1 2 3 4 1 ( ) _ i i i i i i i D = Φ− P = β +βPF +β LO +β SE +β RE SC +ε (2) 其中,D1 是虚拟变量,如果进入三大“热门”学院(通信与信息工程学院,微电子与 固体电子学院,电子工程学院),D1 取值为1,否则为0。用这个变量可以来衡量考生是否 8 东中西部省份的分类标准来源于中华人民共和国国家统计局网站。东部省份(直辖市)为:北京、天津、 河北、上海、江苏、浙江、福建、山东、广东、海南、辽宁、吉林、黑龙江,中部省份为:山西、安徽、 江西、河南、湖北、湖南,西部省份(直辖市)为:内蒙古、广西、重庆、四川、贵州、云南、西藏、山 西、甘肃、青海、宁夏、新疆。 进入优等专业。RE_SC 为考生“高考分数”对考生的“城乡属性”做一元回归后的残差。 290 PF 表示考生是否是应届考生的虚拟变量,应届为1,往届为0。性别的差异也可能会对选择 专业有影响,所以引入了SE 作为表示性别的虚拟变量,男性为1,女性为0。LO 的定义与 方程(1)相同。 同时为了使结果更具说服力,我们使用另一种处理方法来分离“受教育成果”和“获取 学术论文网Tag: |