1.1 探讨背景
在教学过程中,我们经常会遇到这样的情况:某一个学生在相同科目相同内容的不同测验中获取了不同的分数。对此,英语论文题目,我们会产生以下几个疑问:在这些分数当中,哪一个分数能够比较准确地告诉我们这个学生的具体能力水平?两个分数或多个分数之间是否具有可比性,不同学生的分数异同是否能够表示学生与学生之间的能力异同,即分数越高的能力越强,分数越低的能力越弱?关于相同学生取得的不同分数,我们应当如何进行解释?我们能否找出造成分数异同的原因,是学生能力的变化,是测验形式、难度的不同,还是由于测试环境的作用?这些疑问可以归结为教师在实际工作中迫切需要解决的两个测验评测问题:如何通过测验分数把握学生的能力情况以及如何处理不同测验之间的分数等值问题。但是当前存在的实际情况是,中学阶段的普通教师很少能有意识地去关注测验的评测,对分数的统计处理更多的是出于工作上的需要而非试图解决上述的两个问题。如笔者所在桃源中学,只有在期中和期末考试之后,教师才需要对测验分数进行略论,其中需要处理的数据主要包括:各班的测验平均分、及格率、第一名及最后一名学生的分数、90 分到 60 分之间以十分为组距进行分组的各组人数以及在总人数中所占的百分比等。这样处理的目的只是为了便于行政上评选出各科成绩的前三名进行奖励,对学生个体和测验试题并没有作进一步的略论。关于学生能力的把握,教师只能通过测验分数登记表里的分数数据进行优、良、中、差的主观判断,对不同测验分数间的异同也只是从主观感受到的异同大小程度来进行对比以得出学生进步或退步的结论,而由这种主观判断和感受所得出的结果的误差无疑是非常大的。
1.2 相关概念的界定
心理学中的潜在特质理论认为,心理结构可以概念化为隐藏在可观察的显性行为变量下不能被直接观察到的潜在变量【1】【2】【3】。这种潜在变量可以称为潜在特质,它是指被试某种相对稳定的、支配其对相应的测验项目做出反应,并对反应表现出一致性的内在特征【1】。学生的测验分数是外显可观察的变量,这个变量会受到学生个人因素的作用,包括对学科知识的把握程度、对测验试题的熟练程度、应试技巧以及个人对考试的态度等等,而且这些因素在一定时间段里是稳定且不会发生改变的,因此将这些和学生个人有关的因素用能力这个概念来概括,能力可以认为是学生的一种潜在特质。通过外显的测验分数来对能力进行略论,需要建立在教育与心理测量理论提供的将外显行为和心理结构关系起来的理论基础之上。由此我们需要通过分数对学生的能力作略论和评估以及对不同测验进行等值对比,这就必须应用到相关的教育与测量理论。教育与测量理论主要有经典测量理论(Classical Test Theory,简称 ctt)、概化理论(Generalizability Theory,简称 GT)和项目反应理论(ItemResponse Theory,简称 IRT)三种。这三种理论对如何将被试个体能力与外显的测验观测分数关系起来是不相同的,这个在后文会详细论述。
1.3桃源中学的相关情况介绍
桃源中学位于梅州市大埔县桃源镇,是乡镇一级的初级中学,距离大埔县城约 100 多公里,距离最近的初级和高级中学约 15 公里,是桃源镇唯一一所初级中学。学校生源主要来自桃源镇及周边地区,学生总人数为 388 人,其中初一有学生 148 人,初二有 122 人,初三有 118 人。教师共有 44 人,在读探讨生两人,本科毕业生 5 人,通过自考函授或者其他形式取得大专文凭的有 37 人。大埔县属于省级、市级以及国家级的三级贫困县,桃源中学的教学资金主要来源于县教育局的拨款和乡绅以及同学会的捐赠,在 2017 年通过教育强镇的评审后获得了省教育局的专项拨款,在教学硬件上进行了改善。当前,三个年级的级组办公室均配备有 4 台计算机,各台计算机均可通过电信的光钎线路登录互联网,但计算机的性能参数不高,cpu 还是采用奔腾 4 的处理器,内存在 512 兆左右。
1.4 探讨的目的与意义
学校现行对测验分数的统计略论措施在现实中是无法解决对学生能力进行略论以及分数等值对比等问题,有必要应用教育与心理测量理论对测验分数作对应的略论和处理,探究适用于中学普通测验的评测措施和途径。本文将围绕这一主题展开论述和探讨。同时,如何将测量理论的应用于实际也是项目反应理论当前探讨的热点问题之一,本文的探讨和讨论对其他探讨者在此领域内的探讨具有一定的参考影响,英语论文题目,本文的探讨结果是有意义的。本文的探讨目标主要有:1、通过对采集到的分数数据进行统计略论,探索项目反应理论的具体运用措施;2、将经典测量理论和项目反应理论对数据的略论结果作对比,验证前者优于后者的地方;3、应用项目反应理论对不同测验的分数作等值比较。
第二章 有关教育与心理测量理论的综述
|