《医学统计学》考试方法的比较分析
未知 2012-01-31
关键字: 医学统计学 考试方法 比较
【摘要】 目的 为了了解《医学统计学》教学改革工作中存在的问题,了解《医学统计学》考试方法改革的利弊。方法 搜集97~99级临床医学本科生《医学统计学》的考试试卷和成绩,对试卷从学生成绩的分布、信息难易度、区分度等方面进行了综合分析,并且对该课程的考试方法改革前后进行比较研究。用SPSS for Windows12.0建立数据库和有关的数据处理。多组间比较根据资料的性质不同分别选用one-way ANOVA和Kruskal-Wallis Test的比较方法,多重比较使用LSD法。两组间比较选用Mann-Whitney Test法。结果 99级临床医学本科生《医学统计学》的考试成绩低于97~98级的临床医学本科生《医学统计学》的考试成绩(U=5.702,P=0.000);99级学生中,一系和二系的成绩优于三系的成绩(P=0.011和P=0.033);97级的试卷可靠性好,99级的可靠性较好,98级的可靠性一般;3份试题的难度和区分度综合评价结果,以99级的为最优(X 2 =7.580,P=0.065);《医学统计学》考试方法改革前后的难度无统计学意义(F=1.885,P=0.163);3年临床医学专业《医学统计学》试卷的全卷区分度考试方法改革后的比改革前的大,97级与98级比较P=0.004,97级与99级比较P=0.007,98级与99级间无差异P=0.435。结论 对五年制临床医学专业《医学统计学》教学与考试的改革实践结果表明:学生比较适应于记忆的内容,对实际应用的方面感觉较难;作业对学生知识的掌握有一定的作用,发散性的思维锻炼可以促进学生学习的积极性。
关键词 医学统计学 考试方法 比较
《医学统计学》是本科临床医学专业的必修专业基础课。在教学过程中,学生普遍反映《医学统计学》抽象、难学。为了进一步了解在教学改革过程中存在的问题,本研究收集了97、98和993级的临床医学专业(五年制)的《医学统计学》试卷进行具体的分析和比较研究,可以找出在此课程教学改革工作中存在的问题,了解《医学统计学》考试方法改革的利弊。为教师调整教学内容,改革教学方法,提高教学质量和以后的教学改革提供理论依据。
1 资料来源和方法
1.1 情况简介 临床医学专业医学统计学课程属于必修专业基础课。在以前医学统计学是《预防医学》中的一部分(卫生学和统计学各占50%),教学一般是分前后9周2个阶段进行,考试“单科独进”。历年来教研室一直严格把关,认真施教,采用统一命题,闭卷考试方法,学生学习成绩一直很好。在医学教育改革的影响下,从99级临床医学开始,把《预防医学》分成《医学统计学》和《卫生学》两门课。临床医学本科生《医学统计学》的考试,自从98级开始,采用了以“医学实践问题为中心”的方式来出题,结果99级325人参加考试,有75人不及格;98级12人参加补考,有10人不及格,引起了教研室广大教师的高度重视和警惕。
1.2 资料来源 97、98、99连续3级五年制临床医学专业的医学统计学试卷。试卷命题均由作者亲自完成,阅卷均是采取流水作业的方式,统一评分。3届学生在年龄、性别比例和招生来源等方面基本相同。大课任课老师和实习指导相同,判卷按统一标准答案,由任课教师每人1题,公正评分。97、98级学生是以书本课后的练习为作业,而99级一系学生的作业是:从中华系列或中国系列的专业杂志中找一些相关的文献,要求根据所学医学统计学知识对文中所涉及的统计设计、统计指标和统计方法的选择使用加以 ˇ 基金项目:本项目受浙江大学第六期SRTP项目的资助正确理解、识别其正误并且加以评析,99级二系的学生是以书本课后的练习为作业,99级一系学生老师没有布置任何作业。
1.3 方法
1.3.1 统计方法 用SPSS for Windows12.0建立数据库和有关的数据处理。多组间比较根据资料的性质不同分别选用one-way ANOVA和Kruskal-Wallis Test的比较方法,多重比较使用LSD法,两组间比较选用Mann-Whitney Test法。
1.3.2 试卷信度采用分半信度方法 其计算公式:r S-B =2r 半 /(1+r 半 ),r 半 为分半相关系数,即按试卷奇偶题得分计算其相关程度。分半信度系数0.9以上,可靠性好:0.8~0.9,可靠性较好;0.6~0.8,可靠性一般;0.6以下,可靠性较差 [1] 。计算得97级卫生统计学试卷分半信度系数为0.96。对98级试卷采用克伦巴赫系数法,其计算公式:C=n(1-∑ n i=1 S i2 /S 2 )/(n-1),其中n为试卷总题数,S 2 为考试总分数的方差,S i 为第i题的方差。C在0.5~0.9范围内较好 [2] 。98级试卷信度系数为0.56。对99级试卷采用分半法(按难度相等两半两分)计算其信度:ρ=2r/(1+r),先将n个试题按难度从小到大排列,取顺序号单号为一组,双号为一组,其次求各题的平均分数,然后求这两组的相关系数即为r,计算ρ=0.69,即99级试卷信度为0.69。试题难度是考生对某一试题作出正确回答的百分率,用难度系数P表示。小样本时:客观性试题P=答对该题人数/考生总人数:主观性试题P=考生该题平均得分/该题满分。大样本时:P=(P H +P L )/2,其中P H 为高分组该题的难度,P L 为低分组该题的难度。按难度四级分类法(P>0.8,易;0.65~0.8中等难度;0.5~0.65较难,P<0.5难)。
1.3.3 区分度是衡量试题、鉴别考生水平差异能力的重要指标,用D表示。公式P=P H -P L 。本文采用得分率求差法(Johnson法)求全卷区分度:D=X H -X L N(H-L) ,其中X H 、X L 分别为27%高分组,27%低分组的总分,H、L分别为最高分和最低分,N为各组人数。
2 结果
2.1 考试及总体得分情况,见表1、表2,图1~3。表1 3届学生《医学统计学》考试总体得分情况从表1可见,3年试卷的学生成绩总分的总体分布是呈偏态分布的。97、98级的平均成绩差不多,以99级为最低,学生间总得分的差异以99级为最大。不及格率也是以99级为最高。表2 三届临床医学学生《医学统计学》考试成绩的分布情况对表2中资料分析表明,三届临床医学学生《医学统计学》考试成绩分布是不同的(X 2 =65.469,P=0.000),其中97级和98级间没有差异(U=1.715,P=0.086),99级临床医学学生《医学统计学》考试成绩比前两级的差(U=5.702,P=0.000)。
2.2 试卷组成及得分情况 97、98、99连续三级五年制临床医学专业的《医学统计学》试卷的题型、题量、分值以及学生的得分情况见表3。
2.3 99级三系之间的比较情况 99级临床医学《医学统计学》考试的平均成绩二个系之间有统计学意义(F=3.63,P=0.028);一系与二系之间没有差异(P=0.656),一系平均成绩比三系高(P=0.011),二系平均成绩比三系高(P=0.033),见表4和图4。
2.4 试卷质量评价情况
2.4.1 试卷信度 97、98、99连续三级五年制临床医学专业的《医学统计学》试卷的信度分别为0.96,0.56和0.69。97级的试卷可靠性好,99级的可靠性较好,98级的试可靠性一般。
2.4.2 难度和区分度 试题的难度和区分度是衡量试题质量的量化指标。三年临床医学《医学统计学》试卷的难度分布见表5。三年临床医学专业《医学统计学》试题的难度无统计学意义(F=1.885,P=0.163)。表3 三届学生《医学统计学》试卷组成及学生得分情况年级 表4 99级临床医学《医学统计学》考试成绩情况三年临床医学专业《医学统计学》试卷的全卷区分度有差异(F=6.029,P=0.005),区分度以97级试卷为最差(97级与98级比较P=0.004),97级与99级比较P=0.007,98级与99级间无差异P=0.435),见表6。表6 3份《医学统计学》试卷的区分度分布情况年级 2.4.3 3份试题的难度和区分度综合评价结果,以99级的为最优(X 2 =7.580,P=0.065),见表7所示。表7 3份《医学统计学》试卷中的各小题质量综合评价情况
3 讨论
3.1 3届学生考试成绩均呈负偏态分布,即分布曲线高峰右偏,高分人数较多。《医学统计学》考试的目的是检查学生对基本概念、基础知识和基本统计分析方法的掌握程度,即检查学生是否达到教学大纲的要求,所以其3届学生考试成绩分布类型是与实际要求吻合的。
3.2 信度表示考试的可靠性,即考试结果是否真实反映考试的实际水平,影响信度的主要因素是测量误差。一个考生的实得分数由两部分组成,一部分是凭他所掌握的知识确能得到的真实分数;另一部分是因试题不合理,包括试题难度、代表性、覆盖面、教师编制试题的主观偏见和随意性等因素而影响了成绩。3份试卷中,97级、99级试卷信度较好,98级试卷信度不理想,应改进。可以通过增加同质试题数的方法提高其信度 [2] 。
3.3 3次考试的平均难度分别为0.76、0.74、0.68,与国内关于考试试卷P值在0.60~0.80之间为宜的观点相符 [3] ,可以认为3份试卷难度适中。
3.4 试卷区分度是说明试卷能否反映学生水平差异的指标,区分度好能反映学生的真实水平,区分度差则说明成绩是随机的,不能反映学生的真实能力。98级、99级全卷区分度均优于97级试卷区分度,但是3届试卷的区分度水平一般。
3.5 衡量试题质量的两个指标是难度和区分度。根据难度四分法,97级试卷易题占47.4%,难题占5.3%,易题所占比重过大,使整张试卷显得过于简单,高分人数偏多,成绩呈负偏态分布;98级难题所占比重相对易题大;99级难题所占比重与易题相当。一般来说,整张试卷易题和难题各占1/4,中等难度的试题占1/2,因此应减少97级试卷的易题,增加难题,而98级试卷则相反,99级的难易题分配尚合理。若简单的试题为学生应该掌握的基础知识,作为课程考试题仍可使用。1965年,美国检验专家L・Ebel根据长期经验提出用鉴别指数评价题目性能的标准:区分度D>0.40试题很好;0.30~0.39之间的试题良好,修改更佳;0.20~0.29试题尚可,仍需修改;D<0.19的试题较差,应摒弃或修改 [4] 。97级试卷区分度在0.19以下的有11题,这些试题不能反映出学生能力的差别,应摒弃或修改;98级试卷区分度差的试题是第一问答题的第5小题,应摒弃或修改,其余试题区分度皆可;99级试卷区分度差的试题有4小题,应摒弃或修改。综合难度和区分度两个指标,97级试卷好试题共9题,适用试题1题,程度适中区分度差,试题9题,没有差题,因此97级试卷试题质量良好,在考虑知识点的基础上,若能减少简单题的比重,质量将更为完善。98级试卷好试题有8题,适用试题和程度适中区分度差试题仅1题,好试题的经验值得以后出题借鉴,98级试卷只有主观性试题,若能增加客观性试验,考察学生基本概念的掌握情况,将更符合教学大纲的要求。99级试卷好试题共18例,适用试题、程度适中区分度差试题及差试题各1题,整张试卷相对来说对学生知识综合运用能力要求更高。
3.6 加强学生能力的培养。97级试卷题型符合教学大纲,分析其各型的得失分,满分10分的词解释平均得分8.1分,满分20分的选择题平均得分15.3分,满分70分的问答题平均得分52.3分,学生对基本概念掌握良好,对基本知识的简单应用尚可以,综合应用能力相对稍薄弱,可看出学生的综合分析能力欠佳,对所学知识不能灵活应用、融会贯通。98、99级试卷题型全部为问答题,学生成绩均较97级差,也说明了学生在综合应用方面存在缺陷。故在教学工作中应注重培养学生对知识的理解掌握、综合分析能力。对此,可以采用在教学中结合实际问题的方法,鼓励学生积极思考,主动学习,自主分析问题。同时,可根据课程特征,运用多样化的教学方法,如采用讨论法、实习作业法等提高 教学效果。并且,在教学工作中,强调平时的作业,使学生把所学内容加深理解和进一步地得到巩固。
3.7 科学化命题。考试是评价教与学效果的重要指标,对教学工作和学生的学习起着调控和指导作用。而命题的科学性、合理性则决定了这一指标的准确度。一套好的试题应该符合教学大纲的内容,具有合适的难度和较好的区分度,较好的信度和覆盖度,能够客观、准确地反映学生的真实水平。故教师应掌握命题技巧,制定命题计划,建立统一的试题评价体系,综合评价学生的能力。
1 洪汝渝.试卷分析.渝州大学学报,1997,14(3):103-106.
2 毛春元.试卷质量的统计分析.淮海工学院学报,1999,8(B12):86-88.
3 张忠伟.统计学原理,杭州:浙江教育出版社,1999,98-104.
4 姜常胜.高等医学院校实用教务管理手册,上海:上海中医学院出版社,1993,58-59.