数 成 绩1 离 差 离差 平方 加权离 差平方 加权值成 绩2 离 差 离差 平方 加权离 差平方 加权值 号 ⑴ ⑵ ⑶ ⑷=⑶2 ⑸=⑴×⑷ ⑴×⑵ ⑹ ⑺ ⑻=⑺2 ⑼=⑴×⑻ ⑴×⑹ 1 1 60 -20 400 400 60 100 20 400 400 100 2 2 61 -19 361 722 122 99 19 361 722 198 3 4 62 -18 324 1296 248 98 18 324 1296 392 4 6 63 -17 289 1734 378 97 17 289 1734 582 5 8 64 -16 256 2048 512 96 16 256 2048 768 6 9 65 -15 225 2025 585 95 15 225 2025 855 7 10 66 -14 196 1960 660 94 14 196 1960 940 8 11 67 -13 169 1859 737 93 13 169 1859 1023 9 12 68 -12 144 1728 816 92 12 144 1728 1104 10 14 69 -11 121 1694 966 91 11 121 1694 1274 11 15 70 -10 100 1500 1050 90 10 100 1500 1350 12 16 71 -9 81 1296 1136 89 9 81 1296 1424 13 19 72 -8 64 1216 1368 88 8 64 1216 1672 14 20 73 -7 49 980 1460 87 7 49 980 1740 15 21 74 -6 36 756 1554 86 6 36 756 1806 16 22 75 -5 25 550 1650 85 5 25 550 1870 17 23 76 -4 16 368 1748 84 4 16 368 1932 18 24 77 -3 9 216 1848 83 3 9 216 1992 19 25 78 -2 4 100 1950 82 2 4 100 2050 20 26 79 -1 1 26 2054 81 1 1 26 2106 21 28 80 0 0 0 2240 80 0 0 0 2240 22 28 81 1 1 28 2268 79 -1 1 28 2212 23 29 82 2 4 116 2378 78 -2 4 116 2262 24 30 83 3 9 270 2490 77 -3 9 270 2310 25 31 84 4 16 496 2604 76 -4 16 496 2356 26 32 85 5 25 800 2720 75 -5 25 800 2400 27 29 86 6 36 1044 2494 74 -6 36 1044 2146 28 27 87 7 49 1323 2349 73 -7 49 1323 1971 29 23 88 8 64 1472 2024 72 -8 64 1472 1656 30 20 89 9 81 1620 1780 71 -9 81 1620 1420 31 17 90 10 100 1700 1530 70 -10 100 1700 1190 32 15 91 11 121 1815 1365 69 -11 121 1815 1035 33 12 92 12 144 1728 1104 68 -12 144 1728 816 34 8 93 13 169 1352 744 67 -13 169 1352 536 35 6 94 14 196 1176 564 66 -14 196 1176 396 36 5 95 15 225 1125 475 65 -15 225 1125 325 37 4 96 16 256 1024 384 64 -16 256 1024 256 38 3 97 17 289 867 291 63 -17 289 867 189 39 2 98 18 324 648 196 62 -18 324 648 124 40 2 99 19 361 722 198 61 -19 361 722 122 41 1 100 20 400 400 100 60 -20 400 400 60 Σ 640 — 0 5740 42200 51200 — 0 5740 42200 51200 x — — — — — 80 — — — — 80 mσ2 — — — — 65.94 — — — — 65.94 — mσ — — — — 8.12 — — — — 8.12 — 为了进行对比说明问题,表1 的统计数据分为两部分,这两部分不同的仅仅是将第1 部分第2 列的成绩分数重新按高至低排序变为第2 部分的第1 列。使之分布图形相同(见图 1 和图2 所示)而成绩分数的排序相反。若将图2 按成绩分数从低至高排序则图形与图1 正 好相反,见图3 所示。 图1 学生成绩(升序)频数分布直方图 Fig. 1 student achievement (ascending) frequency distribution histogram 根据表1 的频数对应成绩1 作出以上图1 分布直方图。根据第1 部分的数据计算出平 均值x 1 等于80。按常规意义“标准差”的计算公式得出真正意义上随机变量与平均值离差平 方和的平方根的均值差mσ1 等于8.12。期望值μ1 等于85 。 图2 学生成绩(降序)频数分布直方图 Fig.2 student achievement (descending) frequency distribution histogram 期望值(众数)=85 期望值(众数)=75 标准值=100 合格值=60 平均值=80 合格值=60 标准值=100 平均值=80 根据表1 的频数对应成绩2 作出以上图2 分布直方图。根据第2 部分的数据计算出平均 值x 2 等于80。按常规意义“标准差”的计算公式得出真正意义上随机变量与平均值离差平方 和的平方根的平均差mσ2 等于8.12。期望值μ2 等于75 。 图3 学生成绩(升序)频数分布直方图 Fig.3 student achievement (ascending) frequency distribution histogram 根据表1 的频数对应成绩2 按升序作出以上图3 分布直方图。平均值x 2 等于80。平均 差mσ2 等于8.12。期望值μ2 等于75 。 从表1 两部分的数据计算得出平均值x 1 与x 2 相等,都是80 分。平均差mσ1 与mσ2 相 等,都是8.12。按常规的方法判定,两部分的教学质量并无差异,因为平均值相等且标志变 异指标相等。但是从分布的期望值μ1 等于85 分,期望值μ2 等于75 分。从表1 的两部分就 可以清楚地区别第1 部分的整体教学质量优于第2 部分的质量,并且从图1 与图3 的分布状 况来表明。图1 的期望值接近标准值,而图3 的期望值则接近合格值,从分布形态分析图1 的学习成绩指标围绕85 分波动,图3 的学习成绩围绕75 分波动,由此从分布图形就可以对 比教学质量的优良状况。但是按平均值与传统意义上的“标准差”来判定则教学质量并无差 异。 平均值应用的广泛性使之在统计的实际应用中客观地存在一定的误区。“平均数是统计 分析中使用频率最高的用来描述数据分布集中程度的统计指标,平均数的特点是容易受到数 据取值中极端值的影响,这就使得平均数看似精确的背后往往隐藏着未知的陷阱[6]。”由此 说明平均值的使用一定要考虑统计研究对象的分布规律。不同的分布规律所应用的统计指标 应该有所区别,如果都用平均值来表达带来的结果必然会出现一定的统计误差。所以“统计 方法的正确应用有助于我们认清事物的真象、发现事物变化的数量界限、揭示事物发展的内 在规律。相反,统计方法的错误使用,将造成事实的扭曲、读者的误解,甚至决策的失败。 统计在许多应用领域都存在着不同程度的误用[6]。”国家统计局公布职工工资平均水平的统 计指标被公众质疑[7]已经说明平均值在偏斜分布的情况下是缺乏代表性的。 以上剖析充分说明平均值在应用中具有一定的局限性,在双侧规范的条件下,当服从正 态分布且平均值等于标准值或接近标准值时,平均值指标无疑具有很好的代表性。在不满足 期望值(众数)=75 标准值=100 平均值=80 合格值=60 上述条件时其代表性问题就被降低了,由此说明平均值指标在不满足条件的情况下,统计指 标的选择和设置是值得考虑的问题。所以设置适合于满足条件的统计指标来反映教学的实际 情况是满足科学评价的需要。因为统计分析需要从相同条件下找差异。 3 学习成绩评价指标设置的思考 在实际的统计现象中,不论是自然现象还是社会经济现象,随机变量的频数分布客观存 在着正态分布、近似正态分布、偏斜分布和其它分布形况。反映出分布具有随机性的显著特 征。不仅如此还必须考虑质量控制的多样性特征,即:统计对象是属于单侧规范,还是双侧 规范,或是多侧规范。它们具有的分布状况也不尽相同。这些复杂而又有交叉的随机现象, 从统计研究对象角度的不同,就需要考虑选择不同的位置特征值,随机变量与不同位置特征 值离散程度的变异指标对统计现象现实有不同的作用。况且以不同的位置特征值为中心还客 观存在对称与不对称的两种可能,由此又引出左右变异指标的概念。其目的就是为了“把数 据间存在的差异解释清楚。[8]”所以说,仅仅用平均值和单一传统意义上的“标准差”要想把 数据间的差异解释清楚已经不能满足统计分析的要求了。要说明某一统计现象必须考虑分布 规律、所属的质量控制特征、对称性等客观条件的适用方法。有的仍然需要用平均值、有的 需要用期望值(众数)等等。对应的变异指标有平均差、左右平均差,期望差、左右期望差, 标准差、左右标准差(在统计学习成绩的条件下只存在左标准差。)。它们具有的不同作用 能够把数据间存在的差异解释得更清楚一些。 在双侧规范且服从正态分布的条件下,适用的指标仍然是平均值,此时平均值等于期望 值,离散程度的变异指标适用于标准差、左右标准差。理由:最好水平的标准值位于双侧规 范的中心点上。当平均值等于标准值时,均值差等价于标准差,当平均值不等于标准值时, 随机变量与标准值离散程度的变异指标用于判定质量比均值差较为有效。如果以标准值为中 心不对称时需要考虑应用左右标准差来说清楚数据的差异来自于左边还是右边。在平均值偏 移标准值时,需要考虑适用期望值(众数)由此考察期望值与标准值的关系,从统计分析的 角度考虑,应用期望值与标准值对比更能解释数据间存在的差异。 通过以上讨论分析,在教学管理统计学生成绩进行评价时,适用的指标应该是期望值(众 数),离散程度的变异指标适用于左标准差。理由:最好水平的标准值位于频数分布右边的 端点上,仅仅存在左标准差,学生学习成绩随机变量与标准值离散程度的变异指标左标准差 判定教学质量要比随机变量与平均值离散程度的变异指标平均差判定教学质量更能说明问 题。道理非常明了,若成绩差于平均值的同学与平均值相比,得出自己的成绩与平均值的差 距,有一定的意义。若成绩优于平均值的同学与平均值相比,得出自己的成绩与平均值的要 好,其意义不大。若与最好水平的满分标准值相比才有的意义。实际上每一同学的考试成绩 都是与标准的满分相比来找准各自的差距,这就是计算标准差的实践意义所在。 以下按表1 的资料说明评价设置新指标的实践意义。 4 新指标设置所涉及到的新概念及实践意义 以上分析所述应用期望值(众数)和左标准差这两个统计指标相比传统平均值和平均差 要切合实际得多。通过表1 统计资料的计算结果来进一步说明。对所涉及到的新概念有必要 进行定义。 标准值(standard value):产品质量指标可以达到最好水平的目标值作为对其为满足 质量要求的准则和依据,将目标值统称为:标准值。符号记为:sv 。 上述标准值的定义通指产品质量指标,完全适合应用于学习成绩的统计与计算。标准值 的定义为真正意义上标准差的概念确定了随机变量与之对比计算离散程度变异指标 所对应位置特征值的科学依据。 标准差(standard deviation):随机变量与标准值离差平方和的平均值的平方根。符号 记为:sσ。由于标准值两边不一定对称,就存在左标准差和右标准差。在单侧规范的条件下 由于标准值在分布一端的顶点,就只存在左或右一个标准差。学习成绩分布只存在左标准差。 学术论文网Tag:代写论文 代写教育论文 论文发表 职称论文 |