左标准差(left standard deviation):小于等于标准值的随机变量与标准值离差平方和的 平均值的平方根。符号记为:sσ- 。 右标准差(right standard deviation):大于等于标准值的随机变量与标准值离差平方和 的平均值的平方根。符号记为:sσ+ 。 计算标准差需要确定随机变量的频数n, 令:随机变量频数之和为n; 随机变量小于标准值的频数为n1; 随机变量大于标准值的频数为n2; 随机变量等于标准值的频数为n3。 设:标准值左边的频数之和为n-; 标准值右边的频数之和为n+; 则:n- = n1 + n3 ÷2 n+ = n2 + n3 ÷2 满足:n = n- + n+ = n1 + n2 + n3 已知标准值为:sv。 根据以上条件给出计算标准差σs 、左标准差σs- 、右标准差σs+ 的表达式如下: 标准差:σs ={[ Σ= n i 1(xi-sv)2]÷n}1/2 (3) 左标准差:σs-={[ Σ − = n i 1 (xi-sv)2]÷n-} 1/2,xi≤sv (4) 右标准差:σs+ ={[ Σ = − + n i n 1 (xi-sv)2]÷n+}1/2,xi≥sv (5) 根据表1 资料应用公式(4)计算左标准差的结果如下(计算过程略): σs-1=21.587 σs-2=21.587 计算结果得出一个这样的结论:在偏斜分布的条件下,当平均值等于分布中心值时,以 此为轴旋转180o,确定任意一端顶点为标准值,则旋转前后的分布形态相反(见图1、图3 所示),期望值(众数)不相等;平均值、平均差、标准差均相等。 以上考试学习成绩的分布的例子及计算结果得出的结论,给了我们一个重要的启示:质 量指标在平均值、平均差、标准差均相等的情况下,看似质量是没有差异了,但分布期望值 的不相等却反映出差异。这正应了统计学界教育大家张尧庭先生的统计思想:“无论是一元 统计或多元统计,统计分析的中心内容都是数据变异程度的度量和分解,从而解释变异的来 源与影响它的因素是否重要、重要的程度如何。”并说:“能把数据间存在的差异解释清楚, 统计就学好了。[8]”统计分析就是需要从相同中找出差异,进而解释差异的来源与影响它的 因素是否重要、重要的程度如何。 可以从以上的例子及分布直方图中的差异来说明新设置的指标期望值(众数)的实践意 义。 根据统计资料计算结果显示:图1 和图3 的平均值、平均差、标准差均相等。图示表明 随机变量围绕期望值(众数)波动。图1 随机变量围绕85 分波动;图2 随机变量围绕75 分波动。换言之,图1 有众多的同学在85 分周围;图2 则众多的同学在75 分周围。还可以 说,图1 的期望值接近标准值;而图2 的期望值则接近及格值。由此说明一个问题:若应用 平均值来表达就掩盖了不同分布形态的差异。 应用期望值(众数)来评价学习成绩的实践意义之一是:容易解释和显示是否让众多的 同学的学习成绩接近标准值(满分)。当对比的两个总体的期望值(众数)相等时,就需要 对比标准差。如上上述,随机变量与最好水平的满分标准值计算离散程度的变异指标标准差 相比才有的意义。即,以每一同学的学习成绩与标准的满分相比来找准各自的差距,这就是 计算标准差的实践意义所在。 应用期望值(众数)来评价教学质量的另外一个意义是:促使教师关注大多数的整体学 习成绩,而不仅仅是少数成绩优秀的同学。即:需要对比众数接近满分的程度。比较图1 与图3 的学习成绩分布状况,教学质量评估需要的显然是图1 而不是图3。这是设置新指标 评价教学质量的初衷。 在此再次特别指出:在正态分布的条件下平均值与期望值完全等价,所以平均值在满足 适用的条件仍然具有意义。即,期望值在正态分布的条件下就转换还原为平均值了。 通过以上的讨论得出的期望值与标准差的新指标还不足以评价说明教学过程的质量状 况,尤其是满足不了进行统计分析的需要,由此引出反映教学能力满足教学质量要求的综合 指标──教学能力指数。 5 教学能力指数的引出与应用的意义 教学能力指数的引出源于社会生产的过程能力指数,但是又不完全同于社会生产的过程 能力指数。由于教学过程属于单侧控制,规定了及格分的下限值,还给出了达到满分的可能。 而单侧控制产品的质量没有规定最高的要求,但是必须满足合格质量的标准要求。可以对比 社会生产单侧规范过程能力指数[9]来说明教学能力指数应用的意义。 控制下限单侧规范产品的质量要求是:满足产品合格质量要求的下限与生产产品可以达 到的最好水平值之间为产品合格的质量要求区间。从生产成本来综合考虑,没有必要都达到 最好水平值。如:鞋业生产,耐用性没有必要穿四年五年,式样一两年落后了。电脑没有必 要用十年八年,技术更新之快也一两年就落伍了。况且质量要求没有规定出最好水平值。所 以单侧规范产品的质量不是越高越好的概念。在满足符合质量要求的条件下,综合考虑如何 降低成本才是最重要的,这与学生学习成绩的质量要求完全不同。 控制下限单侧规范产品的过程能力是:3 倍随机变量与最好水平值的标准值离差平方和 平均的平方根。即:3 倍标准差。 社会生产“过程能力指数是指过程质量要求与过程能力的比值。[10] ”过程质量要求是分 子,过程能力是分母。或是说 “衡量工序质量的重要标志是过程能力,过程能力是指工序处 于受控状态下的实际加工能力,也称为工序能力,它是衡量加工过程的内在一致性。[11]” 教学过程学生学习成绩的质量要求是:及格分与标准的满分之间,与社会产品质量要求 不同的是规定了最好水平标准的满分。要求学生的学习成绩向满分的标准努力,达到满分最 好。 教学能力与社会生产过程能力的意义是一样,是:3 倍学习成绩与标准满分离差平方和 平均的平方根。即:3 倍标准差。 教学能力指数公式与生产过程能力指数公式分子不同应用的是公式(6),分子相同应 用的是公式(7)。 教学能力指数公式:CP =(v–TL)÷ 3sσ (6) 教学能力指数公式:CP =(sv–TL)÷ 3sσ (7) 式中:CP ─── 教学能力指数; v ─── 成绩的最高分; sv ─── 成绩的标准满分; TL ─── 成绩的及格分; sσ ─── 标准差。 式中的成绩最高分v 与成绩标准满分sv 的数学关系是:v≤sv 。公式(6)分子反映的 是实际达到的质量水平,公式(7)分子反映的是质量要求的整个区间。两个公式的侧重点 不同,需要在实际应用中来确定。 从表1 的资料,根据公式(6)计算成绩1、成绩2 教学能力指数: CP1 =(v–TL)÷ 3sσ =(100–60)÷ (3×21.587) = 40÷ 64.761 = 0.618 CP2 =(v–TL)÷ 3sσ =(100–60)÷ (3×21.587) = 40÷ 64.761 = 0.618 计算结果表明平均值相等,标准差相等,分布恰恰相反的情况下,教学能力指数相同。 由此可以从看似相同的总体中,查寻差异之处就是分布的峰值处在的位置有差异──期望值 不相等。 在以上相同点的实例中,探讨影响教学能力指数各因素的重要的程度,进一步深入理解 上述张尧庭先生的统计思想。调整一下表1 数值来对比说明教学能力指数公式影响因素的重 要程度。 将成绩1 图1 中100 分的一名和99 分的两名都调整为85 分,则85 分的频数增加3 为 35 名,此时成绩1 的标准差σs-1=21.610。 根据公式(6)计算成绩1 教学能力指数: CP1 =(v–TL)÷ 3sσ =(98–60)÷(3×21.610) = 38÷ 64.830 = 0.586 0.617 根据公式(7)计算成绩1 教学能力指数: CP1 =(sv–TL)÷ 3sσ =(100–60)÷(3×21.610) = 40 ÷ 64.830 = 0.617 将成绩2 图3 中60 分的一名和61 分的两名都调整为75 分,则75 分的频数增加3 为 35 名,此时成绩2 的标准差σs-1=21.49,根据公式(6)计算教学能力指数: CP2 =(v–TL)÷ 3sσ =(100–60)÷(3×21.494) = 40÷ 64.482 = 0.620 以上调整变化数据采取相同程度的降低和提高,与调整前相比,高分降低后标准差提高 了0.023;低分提高后标准差降低了0.093。结果表明,离散程度的指标提高低分比降低高分 影响程度要大,说明促进差生提高学习成绩较为重要。 从教学能力指数的计算结果来分析,与调整前相比成绩1 根据公式(6)降低了0.032, 根据公式(7)降低了0.001,成绩2 由于60 分的一名和61 分的两名都提高到75 分,而使 指数2 提高了0.002。成绩1 公式(6)与成绩2 计算的条件不同,不利比较。成绩1 公式(7) 与成绩2 计算的条件相同,进行比较,成绩1 由于100 分的一名和99 分的两名都降低到85 分,指数1 降低了0.001,而指数2 提高了0.002。说明促进差生其影响因素较为重要。 以上提出公式(6)与公式(7)作用不同,公式(6)强调促进优秀的学生保持或取得 更好的成绩。公式(7)则侧重于提高整体的质量水平。这有待后续深入的研究。 以上计算结果表明:教学能力指数公式的含义比原来的平均值和平均差有更为丰富的内 涵。应用于统计分析能把数据间的差异解释得更清楚一些。从分子来看,能达到的最高分虽 然具有一定的影响,但是它不是主要的,3 倍标准差则是影响大的因素,它反映了整体与标 准满分的离散程度,所以教学中整体的学习成绩的提高是重要的影响因素。符合现实的状况, 事实是:达到高分的同学如果再增加几分需要花费甚至一倍的努力,而低分的同学若花费一 倍的努力则可以提高十几分甚至数十分。这在教学能力指数公式的应用中可以得到充分的显 示。 6 高斯新分布拟合学生学习成绩分布的表达式 假设学生学习成绩是连续性随机变量,就可以应用高斯新分布概率密度函数来拟合。根 据概率论有关概率分布任意一点上的概率为零的规则,虽然学生学习成绩是间断性随机变量 学术论文网Tag:代写论文 代写教育论文 论文发表 职称论文 |