摘要:
考试如果不断促使学生深入范式和精确掌握范式,学生更有可能陷入范式陷阱,对旧范式产生信赖而非怀疑,因而难以突破范式陷阱的束缚。这样的考试难以激发创新。考试内容及其思维倾向需要引导学生注意到范式的边界和局限,使其对范式陷阱保持警惕和质疑,随时可能突破范式而创新。从以上角度审视,趋同性思维试题易于促使学生陷入范式陷阱,而发散性思维试题益于学生怀疑态度的养成和想象力的培养。与趋同性思维和范式陷阱概念紧密相连的考试制度包括研究生一级学科统考、考教分离和试题库制度,三种制度的内在逻辑均倾向于阻碍创新。试卷保存制使学生缺失了考试后“复盘”反思和师生交流的机会,试卷返还制和当面批改使得考试成为打开的门,成为师生深度交往的契机。试卷保存制庇护教师使用陈题,试题公布制的内在逻辑要求教师持续创新,试题必须与以往不同,因而促进教师教学的持续改进和对该领域最新进展的关注。试题公布制使学生在内心深处知道,自己在未来考试中必将面对新试题的挑战,正如未来人生中将注定面对崭新挑战一样,这使得一代代学生可以从新起点创新跃迁。百分制应向等第制转变,原因在于百分制评分精细而易将学生引入范式陷阱,百分制也不适合发散性思维试题和挑战性试题评判。百分制向等第制转变可以使考试成绩模糊而避免处罚心理暗示的形成和持续强化,避免对创造性个性的损坏因而保护了潜在创新品格。打破课程、学科划分的综合考试有助于学生综合运用各课程的知识和思维方法,包括跨学科的知识和思维方法以从单一范式外新颖地看待问题,这是创新的重要方面。奖学金评审条件中GPA是最基本条件意味着奖学金引导学生取得更精确成绩,这一点不利于创新。奖学金应直接进入激发创新的方方面面,这是奖学金根本逻辑变革。文章基于范式陷阱和创新激发的新视角全面审视考试模式,提出在试题的发散性思维方向、挑战性试题、试卷返还制和面批、试题共享和考题公布制、评分等第制、综合考试、奖学金逻辑向激发创新转变的综合改革,是激发创新、回答“钱学森之问”的关键方向。
关键词:
钱学森之问;奖学金;考试内容;考卷;考试成绩;考试制度。
文献引用:卢晓东. 考试如何激发创新[J]. 教育学术月刊, 2017, 000(002):3-18.
作者简介:卢晓东,男,北京大学中国教育财政科学研究所客座研究员、三级研究员(北京 100871)
一、引言
1999年,我曾以北京大学为案例对大学考试模式有所研究,指出当时考试存在的主要问题在于考试内容中记忆性成分所占比例大、考试方式单一(主要是闭卷笔试)、期末一次考试定成绩(日常考试较少)三个方面。针对发现的问题,改革的方向也提出来,那就是采用多种考试方式、增加平时成绩占课程总成绩的比重、采用平均学分绩点衡量学习成绩、规定优秀率和不及格率以及增加学生创造性表达机会等。考试模式变革自然引起学籍管理制度变革,包括补考概念消失、考试不及格只能重修、以学分绩点衡量退学以及学位授予标准等变革。[1]
引入平均学分绩点(GPA,Grade Point Average)评价学生学习成绩是考试改革的一个重要方面。当时主要有两个考虑,第一,考试成绩采用百分制,成绩排队也采用百分制评价学生总体学习过于细化。第二,成绩评价需要与国际接轨。实行以4分制为基础的GPA排序对淡化学生对过分细化成绩的追求有效果,期待学生不会为追求几分之间的细微差别而计较,因为两个成绩绩点相同。在对学习综合评价时,采用GPA会粗化评价,使评价合理、准确。[2]
在考试模式变革以及其他教学改革促进下,北京大学本科教学和考试方式有了较大进步。例如,课程中研究论文、报告成为常态,特别在人文、社会科学课程中;小班研讨课上学生的发言、讨论表现也计入成绩。考试模式变革引发学生学习方式变革。例如,因为日常学习表现计入成绩,考试发挥出督促学生日常学习的作用;因为论文和报告成为成绩重要组成部分,学生的创造性研究和表达能力得到了训练。[3]北京大学在大陆大学中考试模式变革相对领先,其考试模式似乎已经足够好。但如果将“钱学森之问”和激发创新作为审视考试的新背景和价值判断标准,考试模式是否仍需改革?方向是什么?这是在信度、效度等传统考试研究视野之外我们特别需要研究的问题。
学术界对创新有多种定义。《剑桥创造力手册》基于文献梳理有所概括,“创新的想法一般有三个特征。第一,创新的想法有着某种不同的、新颖的或者发明的特征。第二,创新的想法是高质量的。第三,创新的想法对于手头工作是合适的,或者重新定义了该工作。因此,创新是新颖的、好的和相关的”。[4]以上定义可应用于生活中的创新如厨艺、艺术创新等,因而是一个适用范围广但较弱的定义。胡锦涛先生2011年4月在清华大学一百周年纪念大会上指出:“要注重培养拔尖创新人才,积极营造鼓励独立思考、自由探索、勇于创新的良好环境,使学生创新智慧竞相迸发,努力为培养造就更多新知识的创造者、新技术的发明者、新学科的创建者作出积极贡献”。这里他以“新知识的创造者、新技术的发明者、新学科的创建者”对学术领域中的创新人才予以定义,高屋建瓴地抓住了创新本质,这是一个适用范围较窄但较强的定义。我们采用库恩(Thomas Kuhn)在《科学革命的结构》中的范式定义及其对科学革命的概括判断新旧科学的界限,其中六个关键词是常规科学、解难题、范式、反常、科学危机和科学革命。[5]教育的目的之一在于让学生了解和熟悉既有学科范式。个体教师的教学内容局限于当下学科范式之内,自身研究主要在当下学科范式中进行,从知识论角度看教师所传授的是“旧知识、旧技术和旧学科”。在旧学科范式中的教学如何能够培养出新知识的创造者、新技术的发明者,培养出在科学前沿有所贡献甚至能突破旧学科范式、创造出新学科范式的创新者?考试在其中发挥了何种作用,又应当发挥何种作用?
与范式的持续学习相联系,本文继续使用衍生概念范式陷阱(paradigm trap)研究考试。学生在既有旧范式中学习,在旧范式中取得成功,但同时,他们学习越多,可能会陷入旧范式越深,越难以跳出旧范式而有所创造,这就是范式陷阱。[6]这一概念非常类似“所知障”。范式是某种“客观存在”,无所谓好,无所谓坏。范式陷阱则存在于个人认识层面,相对范式而言是主观的,其可能构成个人以及群体完成范式转换(paradigm shift)以及创新的障碍。从物理学家普朗克的名言中可见范式陷阱中人出来的巨大困难:“新的科学真理不是靠说服反对者,并使他们看到光明而获胜,而主要因为反对者终于死去了,熟悉这一真理的新的一代成长了。”考试如果不断促使学生深入范式和精确掌握范式,学生更有可能陷入范式陷阱,对旧范式产生某种信赖甚至信仰而非怀疑,因而不愿意,或者说更加难以突破旧范式。这样的考试只是在培养信徒、培养旧学科的忠诚者和维护者,而不是培养探索者、培养新知识的创造者、新技术的发明者和新学科的创建者。如果所有学生都被培养为旧学科的忠诚者或者“常规科学家”,那么新范式将很难被创造出来,创新会受到制约。
从大陆高等教育的历史上看,范式陷阱的制约有时非常危险。例如,从1949年到1976年左右,袁隆平和他同时代的植物学、农学专业学生在求学中遇到了极大风险。多少考试成绩优秀的学生在认知方面深陷其中而难以自拔,而袁隆平却因为成绩不高而幸运地没有陷进去。这个范式陷阱就是“米丘林学说”。米丘林学说是一种没有实验依据的遗传学假说,苏联农艺师李森科借助政治力量打击异己,使其成为苏联主导的遗传学理论。1949年后米丘林学说很快成为中国国家公认、唯一正确的遗传学理论,立即进入了农学、植物学、生物学等高校教学中,成为相关学科主要范式。在袁隆平的课程中,“新遗传学”、“植物学”、“遗传育种学”等都以米丘林学说为基础。[7]
科举考试、高考、国家公务员考试和司法考试等具有很强选拔功能,本文主要研究的大学课程考试不直接具备选拔功能,但间接与学生当下和未来发展紧密联系,例如在奖学金评审、学生升学(保研、出国)和就业中,经由多门课程形成的GPA以及GPA在一个相对学生群体(班级、专业和年级)中的排名具备筛选功能,成绩单作为一种“社会记录”成为学生接受进一步大学教育的资质证明。[8]作为导师的推荐者在填写国内外研究生推荐信时,除去定性推荐意见外会被要求对学生各项能力和学术表现进行排名评估,因此学生一般具备内在动机去追求更好成绩。以上逻辑链条给予教师和学校一种可能性,就是经由考试变革促使学生的学习内容、学习心理、学习动机产生转变,特别是向创新转变。如果教师不自觉地仅将培养当下学科范式中优秀的常规科学家为目的,那么考试就会促使学生深入、细致、精确熟悉当下范式,同时也使学生深入范式陷阱;教师如果将培养突破范式限制的创新者为目的,考试内容及其思维倾向都需要注意引导学生注意到范式的边界和局限,在使学生知道范式的同时使其对范式陷阱保持警惕和质疑,随时可能突破范式而有所创新。以激发创新为目标的考试模式会呈现出新特征,这些特征有助于深刻理解当下考试中存在的问题以及未来的改革方向。
二、发散性思维试题和挑战性试题
(一)趋同性思维试题和发散性思维试题
人的思维模式大体有两个方向。一种是趋同思维(convergence thinking),即把所有人的思维统一到一个标准答案上;另外一种是与想象力相连的发散性思维(divergent thinking),即寻求同一问题的不同答案,探求同一问题新的答案。试题也有思维倾向特征,其中趋同思维试题所趋同的就是当下学科范式。概括而言,名词解释、单项选择题、多项选择题、简答题等都是趋同性试题;复杂的问答题如果有清楚的得分点也是趋同性试题。考试中的试题如果都是趋同性思维试题,易于促使学生陷入范式陷阱,而发散性思维试题则益于学生怀疑态度的养成和想象力的培养。
在人类进化中,在学生未来生涯中,是趋同性思维还是发散性思维更加重要呢?两相比较,发散性思维更加重要。创新的重要特征之一就是求新、求不同,因此发散性思维能力测试也成为对创新潜能最被普遍采纳的纸笔测试。[9]
何为发散性思维试题?北京大学某年自主招生语文试卷中一道试题要求学生对对联:上联是“博雅塔前人博雅”,下联答案就不唯一;一道试题要求曲解两个成语,答案所要求的就是典型的发散性思维。复旦大学“西游记中有几个妖怪”的试题、北京大学自主招生面试试题思维倾向均为发散性思维,也无固定标准答案。以下为北大2011年部分面试试题。
1.今年是辛亥革命100周年,海峡两岸将共同举行隆重庆典。你认为大陆和台湾看待辛亥革命的角度和意义会有什么不同?
2.在鲁迅的小说《祝福》中,“我”作为一个现代知识分子,为什么不告诉祥林嫂“人死后是没有灵魂的”?
3.牛顿第一定律可以被实验验证吗?
北大自主招生将趋同性思维考试成绩和发散性思维考试成绩有机结合在一起录取选拔,实证研究表明通过自主招生的学生比仅通过高考录取的学生具备更佳的发展和学习潜质,他们后期在大学四年的学习表现更加优秀。[10]
北大很多课程期末考试中也有发散思维试题,政府管理学院朱天飚教授主讲的“政治经济学导论”期末考试闭卷,学生需要在六组试题每组中选择一道题目作答,试题也为发散性思维试题。以下为其中三个题目。
1.为什么说全球化并非不可逆转?
2.为什么拉美区域化不如西欧稳定?
3.为什么不存在放之四海而皆准的发展战略?
四川大学目前正在积极推动全过程学业评价和非标准答案考试,以激发学生的批判性思维和独立思考能力,非标准答案考试就是发散性思维考试。例如,该校生命科学学院李静老师《普通生物学》课程的一道考题是:
请设计一个新物种。每个学生从指定的生境中随机选择一种生境,同时选择捕食者或被捕食者中的一种。生境:热带雨林、沙漠、极地、海洋;食物链中的地位:捕食者、被捕食者。
2013年,一位学生设计了一个能进行光合作用的软体动物:绿乌贼;而2014年《生物学公报》(TheBiological Bulletin)杂志报道,确实存在能进行光合作用的软体动物:绿叶海蛞蝓。
(二)挑战性试题与发散性思维试题的区别
如果将激发创新作为教学目标,考试内容应该在逻辑上分为两部分,一部分考查学生对既有范式的掌握,一部分是前沿问题——尚无答案的前沿问题,并以这样的试题普遍挑战学生。这就是挑战性试题。[11]挑战性试题与发散性思维试题有所区别。发散性思维试题是就试题的思维方向而言,这类试题会有很多正确答案。例如,1932年清华大学入学考试中的国文题目为国学大师陈寅恪所出,其中一道对联题目的上联为“孙行者”,下联较为适当的答案包括“胡适之”、“祖冲之”和“王引之”。随着时代前行新的正确答案仍然会产生出来,比如“马化腾”。此外,在基础教育和高等教育阶段,每一门课程都可以出发散性思维试题。
与发散性思维试题相比较,挑战性试题则处于学科范式前沿,或者可能在学科范式之外,当下尚没有取得共识、公认正确的答案。挑战性试题一般不会在基础教育课程中普遍存在(有很少例外),只能在高等教育阶段存在,这是高深知识本质所决定。例如,在当下教育学相关课程中,“钱学森之问”就是一个挑战性试题;另外在“教育财政”、“教育测量”和“高等教育学”课程中一个挑战性试题可能是:中国一流大学如北大、清华,其分省招生名额如何确定才能保证公平与效率的平衡?
挑战性试题既无标准答案,教师如何评判答卷呢?评判的核心当然是答卷中是否呈现出创造性。加州大学伯克利分校教师取得共识的标准是,学生必须发现并且阐释一些对于教授而言新的观点,找到材料支持论点,这样的答卷才能获得A+。挑战性试题是前沿问题并且尚未解决,因而判卷标准并不是仅判断对错。由于开学初学生都知道考试中将面临前沿问题的挑战,了解教师评分标准,其学习动机已受到以创新为方向的导引。毛泽东同志也曾对挑战性试题如何评判提出其建议,他以“红学”中的前沿问题举例:“譬如,对《红楼梦》出二十个题,让学生自己去研究解答,有的学生答出一半,其中有几个题目答得很出色,有创造性,这样的试卷可以给一百分;另外有些学生二十个题全部都答了,是照书本上背下来的,没有什么突出的地方,这样的试卷就给五十分、六十分。”
(三)学科统考、考教分离和试题库制度会阻碍创新
与趋同性思维和范式陷阱概念紧密相连的考试制度包括研究生一级学科统考。按照“2015年全国硕士研究生招生工作管理规定”,统考科目除思想政治理论、语言类、数学类科目外,还包括教育学专业基础综合、心理学专业基础综合、历史学基础以及全国联考科目植物生理学与生物化学、动物生理学与生物化学、计算机学科专业基础综合等。[12]以上学科如果各高校自行出题,题目会保持多样性,也能够出发散性试题,试题会离学科范式陷阱远一些。教育部统一出题时,这些学科教育在全国范围内便开始构架一个深深的范式陷阱。为了方便阅卷,试题会给出标准答案,发散性试题因而很难在统考科目中出现。为了提高考研率,全国很多高校的教学以及学生学习需要与这个范式趋同,有些高校还会根据考研大纲对考试反复训练。这不是在培养创造性人才,而是在培养短期得意的范式陷入者。
与趋同性思维紧密相连的考试制度还包括“考教分离”和“试题库”。所谓考教分离的模式,“就是把课程考试从整个教学过程中剥离出来,相对独立地进行”。其原则和特点是“任课教师不参与或不直接、不单独参与考试过程。比如,在命题方面,或聘请校内外非任课教师根据课程教学大纲命题,或由非任课教师或教学管理人员从试题库中抽取试卷;在阅卷方面,或由任课教师、非任课教师集体流水阅卷,或委派非任课教师阅卷”。考教分离的考试结果被认为“真实准确地反映了教师教、学生学和管理人员管的效果,成为衡量教育质量的一个重要指标”。[13]这种考试易使教学以考试为导向,使学生思维尽可能接近标准答案从而取得“好的教育质量”,这使得学生的学习和思维倾向成为典型的趋同性思维,朝向同一个标准答案、统一到一个标准答案之下同时落入范式陷阱。试题库实质就是代表封闭僵化知识的范式陷阱。考试只从试题库中反复选择试题,虽然变换了题目组合,但其与趋同性思维相结合同样与创造性相背离,这是试题库的内在逻辑缺陷。过往对于试题库的财力和人力投入,从激发创新视角审视很可能都是浪费。据报道,目前吉林大学等许多高校仍在试点推行教考分离和试题库制度,[14]这表明考教分离和试题库制度对创新的阻碍难以取得共识。发散性思维试题有助于创新并非新的见地,但为何难以走入当下的教学和考试?观念上、制度上障碍何在?这仍是值得反复研究的问题。
需要澄清的是,我并不主张任何考试只需要发散性思维试题,我所主张的是应当根据不同课程、不同教师要求以及课程在学生知识结构中的不同阶段,在考试中将趋同性和发散性试题按照适当比例结合在一起,力求使得想象力和当下知识范式、事实有机结合。正如怀特海所说,“想象不能脱离事实,它是阐明事实,使事实多彩的一种方式”。[15]这一主张同时意味着,如果我们的考试仅有趋同性试题,这样的考试将会阻碍创新。
另外一个问题是,发散性试题有各种各样的答案,评判这样的答案是在判断严格的对与错吗?百分制下教师如何给发散性试题答卷打分?打分的意义何在?这需要试卷返还制度和等第制评分相配合。
三、试卷返还和当面批改(面批):反思和师生交流的契机
有观点认为,大学课程考试是检测学生学习效果的手段。北大法学院车浩教授针对这一观点指出,“大学课程一般都相互独立,没有承继关系。经过考试而检测出的教学/学习效果对大学师生双方来说基本都缺乏实际意义。老师没有机会再对特定学生群体改善他的教学,学生也必须告别这门课程进入其他新课程。对师生双方而言,考试成绩不是展开下一步行动的根据,没有向前方伸出一个改善教与学的阶梯。它本身就是一道关上的门,是一门课程结束、一段教学关系结束的终止符”。[16]这一评价鲜明指出将大学课程考试作为检测学生学习效果手段的看法不能充分成立,在教学中的效果更需改进。考试如何发挥改善教学和学习的作用并成为师生深度交往的契机?能否经由这样的契机激发创新呢?这其中的关键就在于试卷返还制度。
(一)耶鲁大学试卷返还制度的启示
大学课程考试后试卷是由学校保存还是发还学生呢?这是考试制度中一个常被忽略但非常重要的问题。北大本科一直保存学生试卷。2008年北大参加本科教育评估,评估也有专家检查试卷的环节,因此该校完善了试卷保存制度,确定将试卷保存5年。“北京大学本科考试工作与学术规范条例”第十一条规定,“评阅后的试卷不发给学生,由任课教师连同成绩单、试卷分析等材料交开课单位教务办公室登记封存,存期五年”。试卷保存制度于是就使学生没有了对试卷和考试反思的机会。与试卷保存制相配合,学生一旦对考试成绩提出异议,学校也制定了“查卷”制度,其逻辑和高考查卷逻辑类似。教育部《2015年普通高等学校招生全国统一考试考务工作规定》中规定,高考答卷扫描图像、评卷信息、考生成绩等,保存期为考试成绩发布后3年。
2006年起,北大与耶鲁大学有一个合作项目称为“北大——耶鲁联合计划”,项目中耶鲁教师到北大上课。耶鲁教师课程试卷均返还学生,并未按照国内要求予以保存。2008年为了迎接评估,应北大要求,耶鲁大学对其试卷返还制度专函予以说明:
耶鲁大学教师将所有期末考试试卷均直接返还给学生,因为他们认识到,在对学生的试卷评价和给出分数之后,使得学生有机会反思(review)他们的答卷具有重要的教育价值。因此,我校的政策是,教师不需要保存试卷和期末论文复印件,这些复印件也没有必要,因为我们的成绩一旦给出就不能更改(除非有笔误)。
试卷保存制使学生缺失了考试后的反思和师生交流机会。考试后学生如果能够看到自己试卷、看到教师评判和评点,学生可以就此与教师交流,与同学相互比较,进而生发极其重要的进步。这一点与围棋比赛中的“复盘”非常相似。对于围棋竞赛者和学习者而言,比赛只是过程,学习和反思发生在赛后的复盘阶段。棋手在复盘中复演该盘棋的记录,检查对局招法的优劣与得失,反思当时是如何想的,每一步如何设计,预想接下来的几步棋和棋局中实际的变化。如果复盘中有棋手的双向交流,双方对每一步棋的成败得失分析讨论,坦诚交换,思维不断碰撞,还会激发出新方案,新思路和新思维。在复盘中胜负不再重要,进步是双方唯一的收获,可以说没有复盘棋手几乎难以进步。试卷保存制度下,考试结束,学习几乎就结束了;试卷返还制度下,考试完成试卷返还后学生学习、师生交流仍在持续。此时,考试是打开的门,是阶梯,是师生深度交往的契机。
将试卷返还给学生,好的一面是学生有反思机会,坏的一面是学生有可能修改试卷,然后向教师讨要分数,这是一种作弊。因此,试卷返还制度的理性设计必须在逻辑上杜绝作弊的心理导向。一个制度的两面呈现之后,耶鲁规定,学生成绩一旦给出就不能更改,从而使学生完全消除了作弊动机,使试卷返还制度成为完全“正能量”的制度。有人说,学生如果真的发现考卷判错了,教师应该有错必纠。其实,这一判卷逻辑与足球裁判的逻辑非常类似,错就错了,分数不必纠正(等第制评分的等第更加不必纠正),学生不起作弊动机最重要。在试卷保存制中教师同样会判卷犯错误,甚至不认真,但因为试卷封存,其实学生和管理者从来不知道,教师也缺乏认真判卷的外部监督。试卷返还后教师判卷反而会更加认真,因为网络发达,教师如果真的判错了,学生会在网上抱怨,对教师的舆论约束反而有助于促进教师认真阅卷。
在鼓励各高校积探索试卷返还制度同时,教育部需要修改教育评估规程和逻辑,促使试卷返还制度普遍推行。
(二)北京大学试卷返还制度的初步探索
经过反复研究,北京大学自2015年春季开始探索试卷返还制度,先行选择化学学院、心理系试点,核心制度如下:
1.考试时,主讲教师向学生公布试卷返还时间,建议教师和院系根据学生人数等因素确定适当的时间和地点。
2.教师和助教在所公布的试卷返还时间之前完成考卷批改工作。试卷返还当天,任课教师和助教接待学生查阅试卷,并与学生讨论考试内容。
3.学生查阅试卷应当在任课教师当面完成,不得动笔修改试卷,教师和助教予以监督;一旦发现学生动笔修改,该门课程总成绩以零分计。
4.学生对试题评阅有意见需当面向老师提出。
5. 学生离开现场时,教师将学生的试卷返还本人。学生一旦离开试卷返还现场后其所提出的任何意见无效。
心理学系“变态心理学”课程参加了试卷返还。任课教师钱铭怡、钟杰教授和助教在现场工作。查卷和讨论时间在网上预约完毕,大约八九名学生预约,时间是中午11:30~14:00。两位教师与学生一一认真交谈,讨论答卷和得失,每位学生约10~15分钟时间。讨论细致,深入问题细节。学生针对考题和答案发表了自己的观点,如脑中的“额叶”算不算器官。有学生增加了1分。组织有序,师生讨论认真。由于有学生援引最新文献对试题和答案提出意见,作为教材作者的两位教师认识到《变态心理学》教材需要尽快根据最新研究成果修订。
(三)“当面批改”是彻底的试卷返还
如果学生不来领试卷,试卷返还的作用将有所降低。为了保证更多同学能到试卷返还现场,更为彻底的试卷返还制度就是当面批改考卷,简称“面批”。教师和助教一对一当着学生的面批改试卷,请学生说明答卷理由,问题可能出在哪里等,每一名学生都必须来到试卷评阅现场与教师对话,一对一的师生交往不会忽略每一个学生。面批工作量很大,北大化学系一名教授200名学生的课程面批需要一周时间。在面批技术环节,教师也可以选择学生面批。美国华盛顿大学教育学院也有教师面批期末作业和论文。对于期末论文,面批比直接在试卷上批注更加有效。教师在作业上的书面批注需要字斟句酌,但仍可能被误解,当面交谈能更好传达意见,启发和激励学生。
面批在基础教育阶段有教师进行实践,在高等教育阶段虽更加重要但少有实践,其原因一是在于教师观念,二是在于教师时间有限,而重科研轻教学的教师评价政策、扩招、财务报销以及其他不适当的管理因素使得教师时间更加稀缺。以上因素也成为大学中激发创新的制度性制约。
(四)发散性思维试题和挑战性试题需要试卷返还制度相配合
试卷返还制度期待以试卷为中介,在教学结束之际进一步促进师生交往,“向前方伸出改善教与学的阶梯”,这一点还与试题思维类型和范式陷阱概念相联系。假如试题都是趋同性思维题目,那么教师给出标准答案,请学生私下核对、反思、商讨,学生自然知道答卷与标准答案有何差别,错了还是对了,此时试卷返还的必要性并不特别大。但如果试题包含发散性思维题目和挑战性试题,那么学生答卷以及教师对答案的判定,教师对学生进一步提高的期望,可能出现的启发、质疑、问难就呈现出更大必要性。例如,对于“为什么不存在放之四海而皆准的发展战略”这个试题的阐释而言,学生阐释和教师阐释间不一定相同,学生阐释不一定正确,教师在判定其等第之后可以书面批注,但师生面对面的对话更能表达教师理由,并能有针对性地给学生以启发。有时学生阐释的理由可能超过教师,教师可能并不同意,于是学生进一步补充以说服教师,这就可能使学生在考试后忽然产生进一步研究动力,也许会有重要研究成果经此契机而产生。课程制需要导师制相补充,试卷返还制另一个层面的意义就是会使课程教师在考试阶段转变为导师。教师在此期间的时间和精力投入对学生学习和创造力激发的效果可能大大超过日常课程阶段,放弃这一契机当然是教学中的巨大损失。
四、试题公布制是考试内容创新和学生创新跃迁的制度基础
(一)试题公布制有助于引导学生突破范式陷阱
据报道,吉林大学的试题库是这样编制和使用的:
吉林大学注册与考试中心先后协调相关学院组织骨干教师,成立由高水平教学专家和测试学专家组成的题库建设小组,成立由具有命题经验的骨干教师组成的命题、审题小组。其中,题库建设小组按规定题型设计了不少于15套题量的大学英语I级试题库和不少于20套题量的高等数学BI级试题库;经审题小组测评后,确定两套题库可分别组出百套以上具有大致相同信度、效度、难易度和区分度的考试题以用于两门学科的期末考试。[17]
以上试题库编制和使用方法具有一定代表性。从知识论角度看,试题库集中于当下学科范式,其边界是有限和固定的,学校在有限的题库中反复组合出题,在思维层面就会将学生思维导入范式陷阱。怀特海曾指出,“要使知识充满活力,不能使知识僵化,这是一切教育的核心问题。”[18]试题库就是僵化的知识。何种考试制度能够保证知识充满活力,并能不断突破范式陷阱呢?答案就是试题公布制。要培养创新的学生,教师也需不断创新。教师所出试题必须与以往所有试题不同。与试题库制度的内在逻辑相反,试题公布制才能促进教师教学的持续改进和对该领域最新研究进展的不断关注。从学生角度看,旧试题公布出来方便了学习,方便学生提前了解自己的水平和实力,了解教师教学要求,同时使学生在内心深处知道,自己在未来考试过程中必将面对新试题的挑战,正如未来人生中将注定面对崭新挑战一样。试题公布制于是导致学生的学习动机发生变化,他们会在潜意识中知道仅仅僵化地“刷题”是不行的,需要在根本上掌握、反思范式的同时做好创新准备。这样的学习在逻辑上不同于刷题。
英国牛津大学实行考题公布制,这是牛津持续高效培养出诺贝尔奖获得者和领袖人物重要的知识论秘诀,该校教师和学生可以通过互联网下载多年试题作为参考。我通过在牛津大学的学生和访问学者看到了该校物理学、哲学两个领域的试题。“伦敦政治经济学院往届考试题全部在网上公开,教师对考试的态度也非常认真,会专门抽出时间向学生讲授试题,给学生布置作业做这些试题。而研讨班实际上也是一种考试辅导,因为研讨班讨论的问题往往就是往年试题。教师会在讨论同时告诉学生怎样答题效果会更好,怎样思考问题更全面,但具体答案会因人而异,因为这些问题并没有标准答案”。[19]
(二)试题公布制是对教师的挑战
试题公布制要求教师不断能出新试题,这个要求极高,教师需要关注学科前沿,参与科研,努力将教学与科研结合起来。只教学而没有科研的教师很难适应这样高的要求,因为知识领域如果狭窄、封闭而不开放,持续出新题很难做到。这就是研究型大学不能有很多单纯教学型教师的根本原因。因此,试题公布制是对教师的挑战。试题公布制对于教学型高校不具备完全可能性,只可以在部分课程中试行。
试题公布制是激发创新在知识论层面的内在要求,但在现实中会给教师增加很大工作量。在技术层面,减少教师工作量的方案之一是减少试题中的趋同性题目而增加复杂、难度大的综合性题目。另外一个方案与下文提到的综合性考试相关联,几门课程教师可以联合出题进行跨越课程边界的综合考试,这样可以减少每一名教师出一整套试题的工作量。
试卷返还与试题公布制紧密联系。学生拿到返还试卷当然可能公布试题。在北大试行试卷返还的心理系,初次尝试中教师十分小心,将考试题目和答题纸分别印刷。教师也反映,如果题目外流,每学期全部出新题是很大挑战,工作量会增加很多;现在课程考试、研究生统考等各类考试很多,所以确实有很多题目重复使用,不公开试题也是不得已的选择。试题公布制会导致教师教学工作量增加,因此理论上期待教师作为学术共同体自发提出这样大的自我约束和自加重负的要求显然不合常理,也十分困难,因此需要外在的促进和激励。教师群体如何能够形成共识?这是尚无答案的问题。
(三)试题公布制有利于学生从新起点创新跃迁
北京大学在研讨试卷返还制度过程中,骨干教师提出了实际问题。一位理科教授的意见值得重视:
每次考试出新题需要花力气研究,特别理科出题是很大难度的工作,不是一拍脑门就出来的。课程考试是检验学生是否学会了,达不达标准,学习过程更重要。因此过去学校历来没有规定一定要出新题,当然不应该每次都拿一套题考学生,那是不负责任的。只要有相当数量的题目,可以出过去考过的题。我教学这么多年,有些问题年年有学生犯错误,因此考察和选拔考试目的不同,考题要求也不同。如果要求每次出新题,教师自己编题有知识产权问题,从尊重教师的角度讲更不应该公开,特别是发给学生。这对教师的劳动不尊重,而且增加教师工作量,这对于老师也不公平。有商家等着你们北大每次考试发卷子,从学生手里买试卷然后出售,肯定很抢手。实际上我们反而引导了题海战术,引导学生为考试刷题而不是真正认真体会课程的基本内容。
很多学生会不断在旧试题上犯错误,因而教师认为旧试题是有效的,这可能是逻辑上的误解。让学生不断犯错误显然不是教学目的。如果把过往试题全部公布,有心的学生会认真研究陈题,教师和助教可以如伦敦政治经济学院一样提前研究和讲解陈题,那么学生在考试之前已经不会继续在旧问题上犯错误了。学生会进步在先,并将完成陈题作为新起点。
人文领域也有教师认为持续出陈题也能评判出答题者的高下优劣。北大历史系曾有前辈教授面试博士生每年都出同一题目。学生即便知道试题,教师也会悄悄评出高下。那么问题出在哪里呢?其实,如果这位前辈和历史系坦然公布试题,学生之间对题目会有深入讨论,教师也可以积极参与其间,充分表达对这个题目的认识和判断标准,未来的学生就会使自己的知识和见地站在教师肩膀之上,进而衍生出批判性的视野而向着更高、更深远的目标前进,这样才能实现“青出于蓝而胜于蓝”的创新跃迁。教师把自己的题目和观点捂着,让学生们暗中猜测其观点,考试中却年复一年地重复陈题,当然不会发挥出考试对创新的激发作用;教师自己也容易止步不前,不能获得新的观点,也不能体验到任何理智的伙伴关系因而无法教学相长。
(四)试卷保存制庇护教师持续使用陈题(旧试题)
北大有教师认为考试中使用部分陈题是可以的,那么其他高校情况如何?试卷保存制下教师当然可以反复使用陈题,不必要用脑子出新题,因为试卷保存在库房,教师反复使用陈题很难被同行和学生发现,因为少有教师去检查和比较试题重复情况。因此,恰是试卷保存制庇护教师持续出陈题,助长了部分教师的懒惰而与激发创新的距离遥远,这是试卷保存制本身的弊端。
教师持续出陈题,学生真实的学习情况又会如何?2016年5月兰州交通大学学生因为该校试题重复严重向校长实名提出意见,这是中国大学考试史中一份重要文献,清晰呈现出这个时代高等教育教学和学习的实际困境:
好多课程考试试题与往年的相似度可达 80%甚至更高,几年来同一门课程的考试题型一模一样,只是变动了几个运算需要的数据。对于这类问题不需要过于理解问题内涵,只要记住解题过程就可以了,对于有些人来说解题也就变成了背题,浮于表面的表面,毫无真才实学可言。[20]
兰州交通大学三位可爱的学生如同安徒生童话中的孩子,不通情理地向校长实名报告并且公布出来,清楚表明如果教师懒惰到持续出陈题,会导致学生临考去“背诵”解题过程,这已经不是学习了。2016年5月在全国科技创新大会上,华为创始人任正非说:“华为现在的水平尚停留在工程数学、物理算法等工程科学的创新层面,尚未真正进入基础理论研究。随着逐步逼近香农定理、摩尔定律的极限,而对大流量、低时延的理论还未创造出来,华为已感到前途茫茫,找不到方向。华为已前进在迷航中。”在国家和企业对创新的需求如此强烈的时代背景下,兰州交大如此考试和教学能否为华为和其他企业送去合格人才甚至创新人才呢?以上情况仅局限于兰州交大吗?在其他大学情况如何?可以肯定,教师懒到出陈题在其他高校也普遍存在,北大曾发生过教师一字不动使用上学期陈题的情况。有同学在轻易取得高分后反而在网上表达对这名教师的不屑。
兰州交大学生实名指出了问题,这表明他们看过之前的试题,也认真有所比较。其中有学生口头同该校教务处张处长谈过,“他给出的评价是:问题看得很准,但凭他一人之力改变不了现状”。该校教务处处长也知道大量出陈题的情况确实存在,也很无奈。
(五)互联网时代的试题分享和试题公布制如何推进?
兰州交大学生如何能够看到旧试题呢?高年级同学考试完毕后会迅速回忆试题,有些还大公无私地将试题分享到了互联网上。新同学可以通过借阅甚至购买的方式看到旧试题。在学生信中也有说明:有些同学平时不学习,“考试前东奔西走,借往年考试试题,开始背题型。因为考试试题简单,不需要在学习上多下功夫就能取得不错的成绩”。在互联网时代,我们也能在网上搜索到该校多门课程试题。北大一个院系的一届届学生早已建立了民间传统,他们将每次遇到的试题回忆起来并保存在网盘,新同学考试前可以自由查阅。试题在互联网时代已经部分公开了!这是互联网+时代对大学考试真正的挑战。
北京大学未名BBS课程版每年期末考试后都有学生将试题回忆出来上网,为维护教学质量默默做出贡献。2016年6月期末试题有些非常完整和细致,以哲学系吴天岳教授的“西方哲学史”为例,限于篇幅只呈现论述题(essay test):
忒休斯之船建造之初命名为船A,随着使用,船上朽坏的木板不断被替换下来而代之以新的木板,直到所有木板都被替换下来,这时将船称为船B。随后,用船A替换下的旧木板按照船A的设计图纸,造出了与船A完全一样的船C。船 A 还存在不存在?如果存在,指出是哪一条船?如果不存在,说明为什么不存在。请以一位哲学家的立场回答以上问题,之后请以你自己的立场对上述哲学家理由的有效性进行分析。
学生普遍知道试题已经公开,而教师似乎并不知道或者装作不知道,于是兰州交大少数教师的懒惰被暴露出来,并造成了学生应付陈题的背诵习惯。互联网时代试题已经公开了,教师还能继续大比例使用陈题吗?如果学生普遍能方便地学习到陈题并从根本上意识到他未来即将面对的所有考试都是崭新试题,学生的学习是否将会是创新时代所期许的学习呢?意识到互联网时代试题已经公开对于中国高等教育具有重要意义。大学管理者和教师是否应当在互联网+时代顺势而为,向牛津大学和伦敦政治经济学院学习,积极推动本校建立试题公布制,将所有试题系统收集,在图书馆和互联网公布以方便学生公平查阅呢?试卷公布制将从根本上督促教师持续创新,不能大规模使用陈题,也能帮助学术界和业界判断一所大学的教育质量,更能推动学生学习心理发生转变而持续创新。
试题公布制因为动了教师的“奶酪”而非常困难,任何一所高校独自前行都阻力极大。促进转变的一种动力来自学生。在共享经济和互联网+时代,学生考完一门课程后可以把试题回想起来,与同学彼此讨论完善试题细节,相互分享和研究试题答案,努力寻找机会和教师讨论自己的见解。之后以互联网为平台,与本校下一届(还有外校)学生分享试题,因此未来学生也能找到上一届老生对当下课程试题的分享,在下一学期学习过程中提前研究和准备,在课程学习过程中与任课教师探讨题目,这是自我学习进步的关键。学生因此将会普遍站在过去教师的肩膀之上!如果教师继续偷懒使用陈题,那么很好,学生可以坦然取得高分并在网上批判一下这类教师的态度和水平。如果知道试题分享普遍存在,未来的试题就不会或者少有重复,一本讲义教一生的情况在中国大学也将难以出现,这是逻辑的力量!基于互联网的试题分享虽是星星之火,但可以燎原。在北大BBS上能够找到学生分享的多门试题,其中包括2015年6月的“原子物理”试题,这份由天文系徐仁新教授所出试题的水平能否经得起同行和学生的考验呢?
1.电子在桌面上方不能静止,会“漂浮”,估计漂浮高度。(没别的条件)
2. 四块黑体板,左边稳定100度,右边稳定10度,求中间两块板的温度和板间能流。(热学题)
3.H的同位素的BalmerH\alpha谱线和H的有微小波长差,计算H的同位素的质量与质子的质量比。
4.Na的2P3/2跃迁到2S1/2在弱磁场下可以产生几条谱线。
5.估计一杯水的分子数、原子数、核数、氢聚变成氦释放的能量。
6.阐述粒子物理标准模型(粒子数目种类、相互作用,如何利用标准模型理解大自然)
在期待有大学先行同时,建议人大代表、政协委员在立法层面推动试题公布制。试题公布制牵一发动全身,是能够促进创新教学和创新学习的核心环节之一。在行政方面,教育部应将教育评估中的试卷保存制更改为试卷返还和试题公布制。有些高校更应该建立内外结合的试题审阅委员会,在考试之前审定试题。试行需要缓慢推进,对于先全面完整公布试题的教师,对于勇于先吃螃蟹的教师,教育部、高校和全社会都要予以奖励。在教育部改革进程尚未明确之前,学生可以持续分享试题,以更加认真的态度分享试题,基于互联网普遍地分享。逻辑的力量会有效促进教育质量提升,学生将是最先和最直接的受益者,这在知识论层面会成为万众创新的基础,成为引发技术爆炸的导火索。
五、考试评价制度的变革方向:百分制向等第制转变
(一)小学的等第制评价改革先行一步
有轶事表明袁隆平大学时非常喜欢一首有关考试成绩的歌谣:“三分好,三分好,不贪黑,不起早,不留级,不补考”。三分是五分制考试评分制度下的三分,百分制中相当于60分,所以歌谣本质上是“60分万岁”。1949年左右中国高校曾有一段时间学习苏联使用五分评分制度,但从袁隆平的成绩单看,西南农学院实际使用的是百分制,因此袁隆平在歌谣中所提及的五分制可能是其中学的评分制度。五分制评分是否与创新培养有关系呢?2016年上海市开始在小学全部年级推广等第制考试评价制度,评价对象从学科知识的准确性转向能力与学科知识结合。[21]2013年,教育部在“小学生减负10条规定”中也提出,要实行“等级加评语的评价方式,采取‘优秀、良好、合格、待合格’等分级评价,多用鼓励性评语,激励学生成长。全面取消百分制,避免分分计较”。小学百分制向等第制转变是向传统的一次回归,其评价对象从精确的知识向能力与知识相结合转变也与世界潮流相接近。类似改革是否值得大学学习?大学生如何能够避免分分计较?
(二)三种成绩评价方式:百分制、等第制和荣誉学士学位划分
大学课程考试目前存在三种评价方式。第一种是百分制,这种评价将学生成绩按照100分来划分,评价最为精细,易于引导学生对范式精确和深入地学习。
美国高校课程成绩评价一般采用等第制(lettergrades system,又称字母制),在对学生总体学习排名时转换为 4分制并以4分制为基础进行绩点排序。1886年,哈佛大学经过10年反思后引入字母等第评价,使用宽泛的等第取代精确总分作为排名依据。等第制相对百分制评价模糊了一些,不倾向引导学生对范式的过分精确学习。
荣誉学士学位(Honor Degree)制度起源于英国。在牛津与剑桥大学,学生成绩不是每门课程的百分制成绩,学生也没有由每门课程成绩形成的成绩单(这是我2010年访问剑桥大学时从三一学院导师王开航处了解到的最为关键的一点)。这意味着学生对每一门课程知识的精细化掌握在剑桥看来并没有特别意义。经过荣誉学士学位考试,学生成绩按照相对排名予以分等,这是对学习最为粗略的评价,在认识论角度暗含的原因就是引导学生避免对过分精确化知识的追求以免陷入范式陷阱。这也是牛津、剑桥成功的秘诀之一。荣誉学士学位分为一等、二等上、二等下、三等和特别等,每一等级人数有较为严格的比例分布,同时学校将学生最终成绩在全社会予以公布。两百年的惯例和制度形成了连续逻辑链条,在昂贵的导师制配合下,学生在没有学期课程考试的情况下也几乎不能懈怠。荣誉学士学位是对学生自主学习的督促和挑战,同时与创新能力培养在知识论层面密切相关。以上三种评价方式中,百分制处于精确的极端,荣誉学士学位处于模糊的极端,等第制居中。
(三)百分制应该向等第制转变
仅凭经验产生的认识能否经受哲学的追问?对当下范式的精确掌握是否有助于创新?这是从创新角度对考试成绩100分的追问。考试在范式之中,这个观念可以很好击碎以上常识性误解。例如,八股范式中的精确如何有助于信息化时代的创新?百分制向等第制转变的第一个理由就是百分制更易将学生引入范式陷阱。在以上三种考试评价方式中,荣誉学士学位分等制度最为粗略和有效,但其逻辑幽深,需要深入理解、广泛共识以及复杂的制度框架才能实现目标。这一制度的细节和内涵可以参考借鉴,但不能模仿以免画虎不成反类犬。百分制评价有利于培养范式中的常规科学家和当下技术范式中的卓越工程师,但如果从培养突破学科范式的创新者而言,百分制的过度精确化有着难以克服的内在缺陷。数学家陈省身先生曾给中国科技大学少年班题词“不要考100分”,这是从同样角度点明了百分制的内在逻辑缺陷。时任中国科技大学校长的朱清时先生虽未使用范式陷阱概念,但其对陈省身题词的延伸解释所要说明的正是同样内容:“原生态的学生一般考试能得七八十分,要想得100分要下好几倍的努力,训练得非常熟练才能不出小错。要争这100分,就需要浪费很多时间和资源,相当于土地要施10遍化肥,最后学生的创造力都被磨灭”了。[22]
百分制需要向等第制转变的第二个理由与试题类型有关。当试题都是趋同性思维试题时,答案按照标准答案判断对错,对错之间界限清晰;但如果试题是发散性思维和挑战性试题时,对错之间的界限就模糊了,教师此时所判断的不是简单的、泾渭分明的对与错,而是学生答案与自己期望之间的迷糊距离,并且需要师生对话去澄清和交流。教师需要反馈学生,也随时准备根据学生阐发而对自己的先入之见有所修正。等第制相比百分制显然更适合发散性思维试题和挑战性试题的评判。
百分制需要向等第制转变的第三个理由与创新者对待错误和失败的心态有关。百分制的趋同性思维试题有标准答案,学生答错就会获得鲜红的“×”并扣分,这是对错误的处罚。学生从小学到高中持续被这样处罚,学生会对错误非常小心,或者可能形成对错误的恐惧心态,这样才能在考试中取得接近100分的完美高分并成为“状元”。[23]创新与猜谜式解难题有着本质区别。猜谜的前提是人们已经知道一定存在正确答案,并且知道谜底的大致方向,但是不知道细节,这时研究工作的特征就是猜谜。清华大学朱邦芬先生描述了一个典型的猜谜过程,这个过程并没有为人类创造出新知识,只是重新猜出了苏联专家没有告诉我们的技术细节而对国家有特殊贡献[24]。
新知识、新技术和新学科的创新与猜谜有所不同,这时的创新探索有时都不清楚问题是什么,即使明确了问题也完全不知道探索前进的方向,更不能确定是否存在正确答案。创新处于完全的迷茫状态,恰如华为当下所处的状态:“随着逐步逼近香农定理、摩尔定律的极限,而对大流量、低时延的理论还未创造出来,华为已感到前途茫茫,找不到方向。华为已前进在迷航中”。真正的创新意味着解决人类整体还未知的问题,对于这类未知问题而言,解决的可能方向是360度的,但其中可能只有一个方向是正确的。要找到这个正确方向非常困难,理论上失败和犯错误是必然的。创新者如果要找到方向必须艰难探索,必将经历一系列错误和失败,恰如当下创新者埃隆·马斯克研制可重复使用的猎鹰火箭所遭受的一次次错误和失败一样。真正创新者不能在潜意识里害怕错误和失败,如果经年累月通过一次次鲜红的“×”扣分处罚错误,会很自然地在学生内心深处引发对错误和失败的恐惧,这种心理倾向很难使得他们成为身处迷茫、不怕一次次失败的创新探索者,这是高考状元很少成为创新者的个性原因(知识论原因在于范式陷阱)。恐惧错误和失败的心理倾向一旦成为个性(personality),就会成为对创新的阻碍。
一个人可以有很强的创新能力,也就是说能够从新颖的角度思考问题,但如果他不愿意承受风险,不愿意否定传统,或者不愿意为了一个被大众嘲笑的想法拼搏,那么所谓的创新能力只是处于休眠状态,不会有创新的思想、产品和技术得以出现。[25]
百分制向等第制转变,使考试成绩成为模糊等第而避免处罚的心理暗示,避免心理暗示的持续强化,可以避免对创造性个性的损坏,因而对于保护潜在创新品格具有重要意义。这一点也是“宽容”这一教学原则背后的原因。[26]
(四)先行者:台湾大学和清华大学的等第制改革
百分制向等第制转变对于创新具有重要意义,其应当是考试评价方式转变的方向。2010年10月15日,台湾大学教务会议通过决议,“教师对学生之日常考查、平时考试、期中考试、期末考试等之评定方式,仍由教师依往例为之,但缴交学期总成绩时,原则上不分学制及新旧生,一律以等第制方式给分(评分方式采通过及不通过之课程维持原制)”。该校作为先行者率先完成了由百分制向等第制的转变。台湾大学等第制评价方案的细节呈现出“模糊评价”的重要特征,比如A的标准就是模糊的“所有目标皆达成”。
A+:所有目标皆达成且超越期望(All goals achieved beyond expectation)。
A:所有目标皆达成(All goals achieved)。
A- :所 有 目 标 皆 达 成 ,但 需 一 些 改 进 (Allgoals achieved,but need some polish)。
B +:达成部分目标,且质量佳(Some goals well achieved)。
B:达成部分目标,但质量普通(Some goalsadequately achieved)。
B-:达成部分目标,但有些缺失(Some goalsachieved with minor flaws)。
C + :达 成 最 低 目 标 (Minimum goalsachieved)。
C:达 成 最 低 目 标 ,但 有 些 缺 失 (Minimumgoals achieved with minor flaws)。
C- :达 成 最 低 目 标 但 有 重 大 缺 失 (Minimumgoals achieved with major flaws)。
F:未 达 成 最 低 目 标 (Minimum goals notachieved)。
X: 因 故 不 核 予 成 绩 (Not graded due tounexcused absences or other reasons)。[27]
在教育综合改革进程中,清华大学也注意到百分制的弊端。清华在“建立促进学生全面发展的学业评价体系改革方案”中指出:“前期调研总结出清华现有评价体系的三个关键问题:第一,百分制的评分方式过于细化,基于细微分数差异的竞争加剧了学生工具主义和功利主义的学习观;第二,重知识、轻能力和素质的评价损害了学生学术志趣的养成;第三,教师在高等教育评价方面的理论知识有待加强,且有必要加强教师职业道德水平的全面提升”。[28]2015年5月,清华也完成了由百分制向等第制的过转变,成为大陆第一所等第制评分高校。
以上对百分制与等第制的分析并不仅适用于高等教育阶段,从小学到高中同样适用并且更为重要,小学等第制探索仍可以继续向初中、高中扩展,其原因并不仅在于减负。高等教育阶段等第制评价需要向台湾大学和清华大学学习,这是考试改革中重要一环。
六、综合考试:打破课程藩篱以促进跨界思考
(一)学科、专业和课程划分都存在局限
人类对知识领域按学科划分的主要原因在于人类自身认识的局限性,特别是群体和个体认知局限性。美国科学史家普赖斯在其著作《小科学,大科学》中曾指出自然科学中学科领域的划分是人为的,并且也不绝对。[29]波特等人最近对1975~2005三十年间六个主要科学领域的研究也表明,虽然幅度不大,但科学学科之间交叉融合的跨学科发展仍在继续。[30]学分制下的课程也在学科范式之内,不同课程教学内容的划分包含了教师的人为和局限性。因此不同大学间的课程名称、学分、教学重点会有所不同。在作为整体的自然和社会背景下,学科划分具有局限,作为课程组合的专业有着局限,[31]每门课程也有局限,三重局限叠加很可能导致学生认知和创新的局限,这就成为学分制本身的局限。在人类认知和创造过程中,当面对前沿、未知问题时,学生需要打通课程的孤立、武断划分,综合运用各课程的知识和思维方法,包括跨学科、跨越单一范式的知识和思维方法以新颖地看待问题,这是回答“钱学森之问”的另外关键。学分制教学运行和管理体系下,大学如何训练学生打破学科、课程划分的能力呢?经由“综合考试”使得学生有机会综合思考和研究是可行途径。如果说一个学科有范式并可能形成范式陷阱,那么从被动角度看综合考试提供了比较的视野,因而会促进学生从多学科角度了解单一学科范式边界,避免进入范式陷阱;从主动角度看,跨学科视角有助于学生新颖地看待问题。
(二)学分制下的综合考试
在学分制下教师和管理者习惯上认为,每一门课程只能单独考试,高校考试制度和成绩登录制度都是这样安排的,但其很可能是误解。综合考试就是多门课程教师共同出题,试题包含各课程内容的核心知识和能力,也要包含一些题目将多门课程的知识有机融合在一起。综合考试要求学生的思维倾向既是分析的,也是综合的,更加强调综合。如果多门课程教师在开学时已经决定期末综合考试,那么教师需要提前研究和改进教学,在自己的课程中先行渗透其他内容,提前引导学生跨越课程分界去思考和解决问题,这意味着综合考试本身又可能引发教学变革。
例如,北大物理系2013级秋季学期有三门必修课:近代物理、数学物理方法、理论力学,三门课程分别考试,另外一个选项就是三门课程综合考试,教师共同出题,考试时间更长,例如4~6小时。综合考试的成绩在学分制下可以分别登录在三门课程成绩中。对于学分数如此之大的考试学生需要特别准备。中文系有三门必修课:文学原理、古代汉语、中国古代文学史,学分制下三门课程分别考试,另外一个选项就是三门课程综合考试,由三门课程教师共同出题。
在研究生教育阶段,当博士生完成所有课程进入论文研究阶段时,往往有综合考试去检验其知识储备和综合思考能力,这个大考试就是综合考试,考察内容完全跨越了单一课程边界。在美国,当医学生完成全部课程和医学临床训练后也有全国性综合考试,考试时间是两个整天。综合考试在本科阶段也可以进行,学分制下尤其显得迫切和重要。
(三)毕业综合考试
推动几门课程综合考试有助于弥补学分制局限,但还不够,需要有机会让学生把其所学的知识全面综合,这是对学生的挑战,也是对学科内教师,尤其是对只关注自己课程教师的全面挑战。什么时间考试呢?只能在毕业之前。这种考试需要与学位和毕业制度联系在一起。第一方案是替代必修的毕业论文成为学生的必修课程,同时使现在的毕业论文和毕业设计转为选修课;第二方案就是使综合考试成为“荣誉学士学位综合考试”。[32]第二方案细节如下:对于期待获得荣誉学士学位的本科生,大学可以在毕业前第8学期(四月或者五月)组织包含四年知识的综合大考,考试内容需要具备高度综合性,这对于命题小组提出了崭新要求。例如,综合毕业考试命题小组可以由教师跨学科组成,例如化学综合考试命题7人小组中可以有5名化学领域教师,还需要有1名生命科学领域、1名物理领域教师。综合考试应当包含前沿性挑战试题、无单一标准答案的发散性思维试题,考试时间整整8小时。综合考试参加学生自愿,是想要获得荣誉学士学位的学生,并且对日常学习成绩有基本要求。
学分制有优点,也有局限,综合考试有助于弥补学分制的缺陷,亦有助于激发创新。在综合考试方面大学也落后于小学。据报道,2015年11月南京府西小学五年级就出了“全科试卷”,语数外三科分值只有60%,音乐、美术和品社等学科考题出现在同一张试卷上。全科考试就是综合考试。[33]
七、奖学金制度的逻辑变革:激发创新
(一)奖学金激发学生何种学习动机?
考试成绩如果100分,意味着这个学生对当下范式掌握精确,同时也意味着他非常习惯以当下范式看待问题,因而可能陷入范式陷阱,他已经很难新颖地看待问题了,这是硬币的两面。多门考试成绩形成的平均学分绩点GPA可以表征学生一段时间(如一学年或者四年)的学习情况。在考试内容缺乏发散性思维和挑战性试题情况下,GPA总体上也是对学习精确性的表征。精确掌握旧范式显然不是创新,也难导致创新,因为GPA太高同时意味着学生更易陷入范式陷阱。
GPA与学生眼前的实际利益紧密联系。第一,毕业后的出路如出国、保研以及就业,GPA高的学生相对会有更好、更多选择机会。仅仅因此学生已具备追求GPA的充足动机,因此政策需要小心,不给学生更多动机追求更高GPA。第二,学生能够直接拿到奖学金,这是金钱的实际利益;奖学金也是荣誉,学生会将奖学金荣誉写入履历,因而奖学金对学生具有很大吸引力。如果奖学金评审条件中GPA是重要指标,那么奖学金就会引导学生追求GPA,这对创新不利。用朱清时的话讲,本来学生处于自然学习状态,考试可得七八十分,创新潜质被自然保留下来,但学生努力不出小错,相当于土地施了10遍化肥,创造力就磨灭了。
大学新生进校面对的第一项奖学金就是新生奖学金。新生奖学金奖励什么呢?北大、清华、南京大学等高校都颁发新生奖学金,获奖标准是高考成绩。2016年6月南京大学设立“苏宁英才全额奖学金”,额度为每人20万元。根据“苏宁英才全额奖学金计划管理章程”,入选者应具备的基本条件之一就是“2016年各省市、自治区考入南京大学的文科和理科第1名”。[34]“清华大学新生奖学金奖励办法”第二、三条为:“对高考成绩(实考成绩或投档成绩)居全省(市)同类科目第1名,或者高中阶段获得国际数学、物理、信息学、化学、生物奥林匹克金银牌的新生,给予以下奖励:(1)新生一等奖学金40000元,分四年平均发放;(2)优秀新生海外研修奖学金,大一期间由学校组织赴海外著名大学研修学习。对高考成绩(实考成绩)居全省(市)同类科目2~10名,或者高中阶段获得全国数学、物理、信息学、化学、生物奥林匹克一等奖的新生,给予新生二等奖学金20000元,分四年平均发放”。[35]
虽然全国多地上演的高考“状元游街”活动更加戏剧化,但以上新生奖学金的本质与“状语游街”相同。新生奖学金一发就是四年,其评价标准首先会对高中生学习观念产生负面影响,同时极大影响在校本科生。如此新生奖学金虽然可能对学校的短期虚荣产生效果,但其长期和大范围的影响是负面的。
此外,各大学奖学金评审条件中GPA都是最基本、最重要条件。国家奖学金目前是高校荣誉程度最高的奖学金,以其评审条件为例。“南京大学国家奖学金评审办法(试行)”对GPA要求为,“在校期间综合表现优异,上学年学习成绩排名在本年级前 15%以内,社会实践、创新能力、综合素质等方面特别突出”。[36]“清华大学国家奖学金评审办法”为:“学习成绩排名在评选范围内位于前10%可以申请国家奖学金;学习成绩排名超出前10%,但均位于前30%,必须在道德风尚、学术研究、学科竞赛、创新发明、社会实践、社会工作、体育竞赛、文艺比赛等某一方面表现特别优秀,方可申请国家奖学金”。[37]按照以上评审办法,袁隆平大学无法获得国家奖学金,一般奖学金也难以入围。
在我国根深蒂固的“状元文化”传统影响下,在加强基础有助于创新的天真观念影响下,从新生奖学金到高校奖学金的评审标准都未经深思地为学生追求更高GPA增加了极强金钱动机。效果如何呢?2014~2015年,清华大学在学情调查中发现:“清华本科生存在着严重的GPA导向的学业成就观,具体体现在学生缺乏学习的内在动机,学习的工具主义和功利主义思想强烈,出现了诸如盲目追求分数、考前刷题、过度答题、刷水课、丧失学习意义感、缺乏学术志向等现象,损害了大学教育的内在价值和质量”。[38“] GPA导向的学业成就观”在大陆并非一两所高校的偶然情况,根子出在教育观念。以GPA作为奖学金基本条件就使奖学金成为引导学生过度精确学习而进入范式陷阱的不良制度,这不会激发创新反而阻碍创新。当前许多奖学金制度研究集中于GPA排序细节以及奖学金的公平、公正等问题,例如“我国高校奖学金综合评定指标研究”等,但核心问题不在机制,而是逻辑:奖学金的基本逻辑错了,奖学金不能奖励GPA。
(二)剑桥大学的经验:奖学金进入激发创新的方方面面
奖学金不能奖励GPA,那么应奖励什么?我国首个民间科学大奖——“未来科学大奖”奖励创新,诺贝尔奖奖励创新,2012年创立的“突破奖”也奖励创新,高校奖学金也应奖励创新而非 GPA。由于学生尚不能普遍做出创新成果,因此奖学金应当奖励学生创新的探索和学习。韦曙林对剑桥大学奖学金制度进行了研究,发现剑桥奖学金制度的逻辑核心就是奖励创新而不是成绩好,不以学习成绩为导向,不把钱给学生让学生请客吃饭、购买手机,不以金钱去促进学生追求高GPA而落入范式陷阱。“获奖者必须把奖金用于购买书籍或出版物、购买设备、出国旅费。旅费是从事与大学职责有关的学习和研究的旅行所产生的费用”。奖学金支持了创新的哪些方面呢?从剑桥几项奖学金的设置可以初步发现其支持的创新方向。
1.约翰·金赛纳和特雷西·赖安诗歌奖(JohnKinsella and Tracy Ryan Poetry Prize):奖励不超过500行的一首诗,面向剑桥全体在校生,获奖作品在Salt 杂志发表。诗歌是思维最发散的文学体裁,此项奖学金面向剑桥各专业、各年级学生,目标无疑是促进发散性思维和想象力的养成。
2. 沃茨旅游学者基金(Worts Travelling ScholarsFund):鼓励学生对英国以外国家的调查,主要是宗教、教育、法律、政治、海关、风俗、礼仪、稀有物种、自然资源、地理发现、古生物研究,发布调查结果后申请补助。此项奖学金直接进入研究过程、特别是跨地区研究,涉及领域广泛。1831~1836 年,剑桥毕业生达尔文毕业后随贝格尔号军舰环球考察,正是在那次航行和考察中产生了进化的基本观念。沃茨旅游学者基金致力于支持未来的“达尔文们”继续有所发现。
3.费恩赛兹奖学金(Fearnsides Scholarship):管理者邀请从事神经系统器官疾病临床研究的学生参加学术会议的旅游奖学金。奖学金直接帮助学生求学期间参加学术会议,直接走向学术前沿,同时与长者交流、学习。学生有机会被创新的长者、创新的思想所环绕,自然会受到激励。目前国内外有很多学术会议,但少有国内本科生参加,其中经费短缺是重要原因。
4. 格兰尼儿童精神病学奖(Glennie Prize in Childpsychiatry):由儿童和青少年精神病学教授提出,奖励对儿童和青少年精神病史的案例做出最佳和次佳诠释的在读临床医学学生。这项奖学金将研究与课程学习紧密结合,是以创新研究成果为标准的奖学金。[39]
以上案例中,奖学金进入了激发创新的方方面面,以创新为导向的奖学金制度无疑是剑桥创新人才辈出的秘诀之一。
加州大学洛杉矶分校有一个机构,称为“本科生教育奖学金资源中心 ”(UCLA UndergraduateEducation Scholarship Resource Center),2014年1月我访问这个中心才发现,该校没有自设的基于GPA的奖学金,学校也不需要评审这类奖学金。1996年成立的“本科生教育奖学金资源中心”的核心任务与使命是服务和信息支持以帮助学生获得校外各类奖学金、助学金。这也表明,不以奖学金支持GPA也许是一流大学的共同逻辑。
目前大陆高校学生将奖学金做何用途呢?有大量新闻报道和研究指出,学生将奖学金用于请客吃饭以及其他高消费环节,[40]未见学生将奖学金用于科研和创新的报道。为此,许多高校出台头疼医头、脚疼医脚的措施,有新闻标题为“华中科技大学明令学生严禁用奖学金请客,违者严惩”;武汉科技大学中南分校也曾专门发通知,挥霍奖学金者今后直接取消参评资格。[41]如果奖学金的根本逻辑变革为引导和支持创新,将奖学金用于吃饭社交、高消费等低效使用将会根本解决。
大学中的规训与惩罚意在恐吓和阻止学生做什么,奖励则鼓励学生积极做什么。奖学金评审条件中GPA是最基本条件意味着奖学金鼓励学生取得精确的学习成绩。但分析却发现:第一,学生取得更高GPA已受到足够激励,GPA高的学生会有足够酬报;第二,当下奖学金成为学费和生活补助,并未补助到需要的学生,这意味着奖学金逻辑不当,也意味着奖学金对更高GPA学生的额外酬报在教育实践中过度了;第三,奖学金引导学生精确学习不利于激发创新;第四,奖学金对更高GPA学生的酬报在伦理上不适当,GPA高的学生不一定会对人类有所贡献。因此,向剑桥学习,使奖学金直接进入激发创新的方方面面,这样的逻辑更加直接。
(三)思想变革和组织机构调整并行
奖学金由鼓励学生取得很高GPA向支持和激励创新转变,这是根本性逻辑变革,必将引发学生学习动机、方向的深刻变革,理论方面也将消解“奖学金综合评定指标研究”这类旧问题,代之以“奖学金支持创新的模式和效益评价”这类新问题。国家奖学金的逻辑具有重要引导作用,财政部、教育部应该开始修订《普通本科高校、高等职业学校国家奖学金管理暂行办法》(财教〔2007〕90号)。在教师、校长、书记、管理者思想彻底转变之外,尚需高校内部管理制度和机构设置变革。目前,奖学金评审大都由负责学生工作的学工部负责,校领导中有一名副书记分管学生工作;本科生教学和创新由教务处负责,校领导中有另外副校长分管。以上综合改革因为可能被视为争权而不可能由相关副书记和副校长本人提出。如果奖学金逻辑变更,传统奖学金评审将基本取消,既有奖学金逐渐转为激发创新的奖学金,这意味着学生工作部的奖学金评审工作将转往教务处,需要成立一个新的中心——“本科生科学研究与奖励中心”,这是综合改革的内容。
研究表明,创新倾向于在这样的环境中开花结果:这样的环境提供充分机会去探索和独立工作,这样的环境中原创(originality)的想法得到支持和珍视。[42]奖学金改革的目标就是将大学改造成这样的环境,用奖学金支持创新,使得创新超越GPA成为大学新的价值观,使奖学金成为探索和独立工作的支持和帮助。
梁实秋先生在《论考试》一文中说,“其实考试只是一种测验的性质,和量身高的意思差不多”。本文的分析表明,考试的本质与量身高意思差得非常远。科学哲学家伊恩·哈金在为《科学革命的结构》五十周年纪念版所写的序言中说,“正因为《科学革命的结构》是一本伟大著作,因此有数不清的阅读角度,也能够用在很多方面”。[43]本文就是以范式及衍生概念范式陷阱对高等教育中的考试(兼及基础教育)——从激发创新角度的一次深入审视。中国是一个有着很长历史的国度,期间积累了很多知识,这使得中国相对于历史较短、传统并不深厚的国家而言,完成范式转换的困难相对更大,因而范式陷阱对创新的制约影响也更大。从范式陷阱、创新的思维模式、创新的交流激发和反思、创新的试题和学生的学习倾向、创新个性的保护、跨学科的新颖视角、创新的支持和创新环境营造角度看,当下高校考试模式及其引导的学习对创新有所阻碍,趋同性思维试题、考教分离、试题库、试卷保存制、百分制、奖励精确的奖学金逻辑需要深入反思,而发散性思维试题、挑战性试题、试卷返还制和面批、试题共享和考题公布制、评分等第制、综合考试、奖学金逻辑向激发创新转变的综合改革,将成为高等教育激发创新、回答“钱学森之问”的关键方向。坦诚而言,在真实教学实践中我并不主张两元论,也就是将考试模式完全分离和对立,真实的教育实践有鲜活的境况,进步可以在点滴处发生并逐渐看到效果。考试改革本质是巨大挑战,实践中更需谨慎、稳定前行。
【信息来源:全国医学教育发展中心 校对:郭艳玲 审核:时华伟】