- 相關(guān)推薦
談歷史學(xué)科的考試評價標(biāo)準(zhǔn)
考試的評價就是對考試的質(zhì)量進行檢測。通常,人們是以對試卷、試題的定性分析和定量分析的方法進行 檢測。定性分析主要是以定量分析的數(shù)據(jù)為依據(jù),對試卷、試題的整體面貌進行描述,它最終應(yīng)回答:“考試 結(jié)果反映命題意圖實現(xiàn)的程度”、“命題意圖反映高考功能實現(xiàn)的程度”這兩個問題。定量分析主要是在對試 卷進行抽樣統(tǒng)計的基礎(chǔ)上,通過信度、效度、區(qū)分度、難度等指標(biāo)對試卷、試題進行多角度的量化描述。為了便于說明問題,在這里我們把定性和定量分析的內(nèi)容改編為一種評價標(biāo)準(zhǔn),并按當(dāng)前歷史科考試的構(gòu) 成分為試卷、試題、評分三個部分。
一、試卷
一、試卷設(shè)計體現(xiàn)《歷史科考試說明》的各項要求。
《考試說明》是依據(jù)《教學(xué)大綱》制定的,它和大綱不同的地方是對考試的一些技術(shù)性問題和實施問題做 了規(guī)定。這主要是:考試的能力要求;考試形式及試卷結(jié)構(gòu),其中包括考試的方式和時間、試卷的分類、考試 內(nèi)容的比例和題型的比例;考試的知識范圍。
《考試說明》是聯(lián)系《教學(xué)大綱》和考試的紐帶,在標(biāo)準(zhǔn)化考試的各個環(huán)節(jié)中,《考試說明》集中體現(xiàn)了 標(biāo)準(zhǔn)化考試的透明度要求,也是用以評價試卷、試題的主要標(biāo)準(zhǔn)之一。
二、考查歷史學(xué)科的主體內(nèi)容
所謂主體內(nèi)容一是指中學(xué)教學(xué)的重點內(nèi)容?荚嚨膬(nèi)容要和教學(xué)的內(nèi)容一致,更要和教學(xué)的主體內(nèi)容一致 ,不然,考試就失去了它的有效性。其實,所謂主體內(nèi)容,在《教學(xué)大綱》中有透徹的解釋,歸納起來就是: 反映歷史整體面貌和發(fā)展線索的內(nèi)容;反映歷史演變規(guī)律的內(nèi)容;反映辯證唯物主義和歷史唯物主義的基本理 論和方法的內(nèi)容;反映國情的內(nèi)容。
另外,主體內(nèi)容亦指與大學(xué)學(xué)習(xí)相關(guān)密切的內(nèi)容。這部分內(nèi)容是指建立在主體知識之上的與大學(xué)學(xué)習(xí)相關(guān) 密切的學(xué)科理論和能力方面的內(nèi)容,即指對歷史事物和歷史現(xiàn)象的綜合、分析、評價的能力。
三、反映學(xué)科的內(nèi)部聯(lián)系和基本規(guī)律
這實際上是對試題科學(xué)性的總要求。所謂學(xué)科的內(nèi)部聯(lián)系有兩層含義,一是體現(xiàn)歷史事物、歷史現(xiàn)象之間 的本質(zhì)關(guān)系,不能孤立地考查知識點,不能片面地、錯誤地解釋歷史事實。二是試卷內(nèi)容對學(xué)科各部分內(nèi)容的 考查要有整體性,也就是說堅持合理的內(nèi)容比例,這個比例一旦失調(diào),內(nèi)部聯(lián)系也就難以全面地反映出來。所 謂基本規(guī)律,是指試題的設(shè)計要以辯證唯物主義和歷史唯物主義為指導(dǎo),引導(dǎo)考生通過歷史現(xiàn)象認識人類社會 發(fā)展的客觀規(guī)律。
四、全面考查學(xué)科的各種能力要求
現(xiàn)在公布的歷史學(xué)科能力共有十項要求,其中第一、二項是識記、理解的要求,做為最基礎(chǔ)的能力要求是 肯定要考到的。三、四、五項是對歷史材料和歷史信息的處理能力,由于材料題的數(shù)量有限,不可能針對每一 項能力要求出一道題,只能是綜合性地設(shè)計題目內(nèi)容,把能力要求包含進去。六、七、八、九項是敘述、分析 、綜合、評價能力的要求,也做綜合性處理。
五、題目難、中、易比例合適,總體難度得到有效控制。
題目難度的控制有這樣幾層含義:其一,大部分的題目難易程度應(yīng)該在0.3-0.7之間,這個幅度里 的題目,其難易程度又應(yīng)相對集中在0.5這個區(qū)域里。其二,全卷題目難度應(yīng)該難、中、易交替出現(xiàn),逐級 由易到難。從我們的試題安排上可以看出,先是選擇題,中間是材料題,最后才是問答題。在每一部分中,難 、中、易不是呈扎堆狀態(tài),而是交替分布。這樣,全卷的總體難度才能得到有效控制。
難度是一個相對的概念,通常人們認為0.5-06之間是合適的區(qū)域。當(dāng)然,如果需要,也可上下調(diào)整 到其它區(qū)域。
六、試卷長度合適
試卷長度是指試題的數(shù)量和參考答案的文字總量之合,試卷過長或過短都會影響考試的信度。在目前的高 考中,在規(guī)定的時間內(nèi)在50%以上的考生完成全卷內(nèi)容,這個長度就是合適的。從現(xiàn)在的情況看,試卷長度 是比較合適的,有的考生做完全卷后尚有時間檢查。
二、試題
一、測試目標(biāo)明確
任何題目的設(shè)計都要體現(xiàn)具體測試目標(biāo),這樣才能夠有效地限制題目的隨意性,達到規(guī)范化和標(biāo)準(zhǔn)化。歷 史學(xué)科的測試目標(biāo)大致可分為幾類,一是對知識內(nèi)容掌握的準(zhǔn)確程度;二是對知識內(nèi)容掌握的深入程度;三是 對歷史事物內(nèi)部聯(lián)系的認識程度;四是理論與史實相結(jié)合的水準(zhǔn),五是歷史意識。在這五類目標(biāo)范圍內(nèi)又可以 分為許多小的類目。在實際操作中,一道題目往往含有一個以上的測試目標(biāo),但幾個測試目標(biāo)在題目中不能平 分秋色,要有主次之分。
二、試題科學(xué)、規(guī)范
試題不能出現(xiàn)科學(xué)性的錯誤。有些問題雖然不能算作錯誤,但它存在爭議,遇上這類問題應(yīng)相當(dāng)慎重。另 外,試題的科學(xué)也表現(xiàn)在題干和參考答案的對應(yīng),題目的測試目的,它所涉及的知識范圍等等,都必須在參考 答案中有相應(yīng)的表述,其層次、范圍、幅度就都是一致的。不能題干龐大,而答案很窄,也不能題干要求很少 但答案要求很多。
規(guī)范的含義是題目的設(shè)計要符合歷史學(xué)科的特點;在表述上有相對固定的形式;在格式和語言的運用上符 合國家規(guī)定的標(biāo)準(zhǔn)。
三、題目角度新穎,立意深刻
在就要求題目的創(chuàng)設(shè)應(yīng)不句泥于教材的表述,設(shè)置新的情境,從新的角度提出問題,這樣的題目往往都含 有較深的立意。如把焚書坑儒和八股取士相聯(lián)系論述問題,這自然就要求從這兩個歷史現(xiàn)象之間的內(nèi)在聯(lián)系上 尋找一個共同角度去展開。把榷場和民族關(guān)系相結(jié)合也反映了這樣的問題創(chuàng)設(shè)新的情境,是測量對已有知識掌 握程序的最有效的辦法。
四、題意明確,表述方式合理
考試當(dāng)中有時會出現(xiàn)因題意不明或由于考生對題目的表述不理解而出現(xiàn)了審題錯誤,這是造成誤差的一個 原因。
題意明確首先是命題者對題目所涉及的知識內(nèi)容準(zhǔn)確掌握,其次是對測試目標(biāo)有準(zhǔn)確理解,再是對知識內(nèi) 容和測試目標(biāo)之間的關(guān)系準(zhǔn)確把握。題目的表述方式應(yīng)該選擇最簡潔、有效的書面語言。
五、題目類型和題型比例合理。
題目類型比例是指主觀題和客觀題的比例。目前歷史科高考試卷主、客觀題的比例是各占50%。在客觀 題尚未發(fā)掘出更好的測量辦法的情況下,這個比例是合適的。大多數(shù)的考生往往是在主觀題這一部分拉開檔次 。題型比例是指各類題型所占的比重。前邊我們已經(jīng)提到選擇題、填空題、材料題、問答題的比例,它們基本 上呈金字塔形狀,這種形狀是為了有效地實現(xiàn)考試目的。它一方面反映了對基礎(chǔ)知識的重視,另一方面反映了 對學(xué)科能力的要求。這種狀況在目前情況下能夠較好地區(qū)分考生。
六、有較好的區(qū)分度
區(qū)分度指試題對不同水平考生的鑒別能力,對于區(qū)分度的掌握,有從整體上看的,也有從局部上看的,亦 有從一道試題上看的。從整體上看,全卷的區(qū)分度應(yīng)該在0.3以上,說明試卷整體的鑒別能力較好。全卷區(qū) 分度好不等于要求每道題都在0.3上,但在考查主要學(xué)科能力的試題上或綜合性較強的試題上要求有較高的 區(qū)分度,這類試題往往是材料解析題、問答題和部分選擇題。在這些題目中,區(qū)分度的要求也是不同的,它們 之中亦有很高、較高之分?傊,區(qū)分度也有一個根據(jù)命題意圖合理布局的問題。
區(qū)分度和難度有著密切的關(guān)系,太難、太易的題目都不會有好的區(qū)分度,只有中等難度的題目才會產(chǎn)生好 的區(qū)分度。根據(jù)這一原理,目前歷史科考試中的問答題里出現(xiàn)了考查再認、再現(xiàn)能力和分析、綜合、評價能力 相結(jié)合的形式,使題目達到一種不難不易的狀況,以求達到好的區(qū)分度。當(dāng)然,問答題最理想的設(shè)計還是從思 維的角度劃分層次,這樣能充分利用題型的功能。
以上是對于各種試題總的評價目標(biāo),但具體到不同類型的試題,也有不同的要求:
[客觀題]
一、試題內(nèi)容適合使用選擇題
從理論上說,選擇題應(yīng)該可以考查各種內(nèi)容和能力要求,但目前對于選擇題的功能尚未完全發(fā)掘出來,也 由于受到試卷長度的限制,所以有的內(nèi)容不適于選擇題使用。比如考查敘述、論證、對歷史材料中所含有效信 息的篩選等,在選擇題中難以實施,尤其是涉及理論的內(nèi)容,弄不好就會形成模式化、概念化的東西。這幾年 ,實際上用于選擇題方面的內(nèi)容在不斷擴大,由最初的考查再認、再現(xiàn)能力的內(nèi)容,擴大到理解、分析、綜合 甚至評價的內(nèi)容。選擇題的發(fā)展方向是在發(fā)掘題目多樣化的同時注重考查歷史思維水平。
二、題干圍繞一個中心,選項和題干的關(guān)系一致
題干圍繞一個中心,首先,題干必須有一個相對完整的中心問題,不能將題干要表達的意思放到選項中去 。其次,題干不能產(chǎn)生歧意。選項和題干的關(guān)系一致是指選項和題干圍繞一個共同的問題,不能出現(xiàn)與題干所 問無關(guān)的選項。
三、干擾項有效
干擾項有效是指對正確項的干擾有效。一道選擇題出的是否成功,除了正確項無誤外,干擾項也相當(dāng)重要 ,因為它起到了調(diào)節(jié)試題難度的作用。如果干擾項不起干擾作用,易被學(xué)生排除,試題難度就會下降,因為學(xué) 生不用對正確項進行分析,只憑排除錯誤項即可做答,這樣,不僅難度下降,區(qū)分度也會隨之下降。所以,干 擾有效也存在一個程度問題。這個程度的控制標(biāo)準(zhǔn)就是使試題達到中等難度為最合適。如何使干擾項有效呢? 一是干擾項和正確項對試題題干的關(guān)系應(yīng)該一致,這個在前邊也講過;二是干擾項應(yīng)該代表考生的典型錯誤, 否則,就會出現(xiàn)干擾項太易或大部分考生把某一干擾項做為正確項的情況。這樣,考試的有效程度就會降低, 在選拔性考試中,這一點顯得尤為重要。
四、各選項的結(jié)構(gòu)、長度大體一致
這實際上是要求各選項要整齊。結(jié)構(gòu)是說句式、用詞、語氣要大體一致,不能出現(xiàn)迥然不同的表述,這樣 容易帶來某種暗示,或者引起評分上的分歧。長度是說文字長度要大體一致,一般來說,選項的文字不宜過長 。如果文字不長不足以表述一個相對完整的意思,那么就要考慮重新設(shè)計題目內(nèi)容。
五、正確選項比例分布合理
從總題量的角度說,正確項應(yīng)該大致均勻地分布在四個選項中,這會降低猜題、蒙題的可能,提高考試效 果。在多選題當(dāng)中,正確項存在一個比例問題,原則上正確項不能集中在某一數(shù)量上,也要有所分布,同時分 布要均勻。
[主觀題]
一、題目設(shè)計體現(xiàn)運用已有知識解決新問題的能力考查要求
運用已有知識解決新問題的能力是對學(xué)科能力要求的一個概括性表述。它體現(xiàn)在試題設(shè)計上應(yīng)該包含這樣 幾層意思:其一,題目涉及的內(nèi)容在教材中有依托。其二,題目要設(shè)計成不同于教材表述的新情境。其三,題 目要引導(dǎo)考生對歷史現(xiàn)象進行新的認識。
這里邊第二條最不容易做得好。因為新情境的設(shè)計首先受到教材的制約,往往是新情境同時也會帶來許多 的新的內(nèi)容,如果這些內(nèi)容在教材中沒有涉及到,就要進行修改、剪裁,弄不好會給人以削足適履之感,有時 甚至?xí)バ虑榫车囊饬x。在歷史學(xué)科中,所謂新情境實際上就是人們認識歷史現(xiàn)象的新角度或展示的新材料 。這些東西不是文學(xué)創(chuàng)作,可以由命題者去編制,它必須來源于既有的材料和現(xiàn)實中人們在研究歷史現(xiàn)象時所 認識到的那些問題以及認識角度,它的規(guī)定性很強,要恰當(dāng)?shù)匕阉鼈兏脑斐梢环N新情境并與考生已有知識對接 ,這實際上是一種特殊的創(chuàng)造性勞動,做到天衣無縫相當(dāng)不容易。當(dāng)然,這并不意味著新情境都會帶來新角度 ,命題者不能一味單純求新,關(guān)鍵還是要看新情境有沒有一定的深度,它自身的認識價值如何。這也是我們評 價問答題時應(yīng)注意的一個問題。
二、考查較高層次的學(xué)科能力
歷史學(xué)科十項能力要求中,涉及對歷史材料的分析運用能力、論證能力、評價歷史事件、歷史人物的能力 應(yīng)該是較高層次的學(xué)科能力。這幾方面的能力有些共同特點,一是理論水平要求高,二是對歷史材料和信息的 處理水平要求高,三是對文字表述水平要求高,總的來說,較高層次的能力要求綜合性強。
較高層次的學(xué)科能力是以較低層次的學(xué)科能力為其基礎(chǔ)的。在主觀題的設(shè)計中,命題者很注意由較低層次 向較高層次的深入梯度,也就是說,涉及再認、再現(xiàn)歷史事實、敘述、理解的能力要求在主觀題中仍占有一定 的份量,所以,確切地說應(yīng)該是重點考查較高層次的學(xué)科能力。
三、難度和答題量與賦分值合理
賦分值是指題目在全卷總分當(dāng)中的比值。歷史學(xué)科四種題型的賦分值不同,從每道題來說,填空題0.5 分;選擇題1分、2分;材料解析題9分左右;問答題12分左右,由此可以看出,賦分值是隨著試題的難度 和答題量的增長而增長的。那么,對于賦分值與難度、答題量的關(guān)系的含義就應(yīng)該這樣認識:賦分值是考試內(nèi) 容含量的顯示,它反映支付思維活動和文字表述活動的程度。難度和答題量的控制依據(jù)是賦分的比值。
但是這里邊有兩個問題需要注意,一是賦分值和難度、答題量的關(guān)系在同一題型內(nèi)是相對整齊的,但不同 題型相比較就復(fù)雜一些,比如十個1分的選擇題和一個10分的問答題的比較只能是大致整齊。在主觀題中, 應(yīng)特別注意分數(shù)的分布和難度、答題量的比重。比重應(yīng)體現(xiàn)能力考查的要求,應(yīng)體現(xiàn)對學(xué)科深層含義的理解。 二是主觀題的難度相對地比客觀題的難度要高一些,不能用整卷的平均難度值去衡量主觀題的難度。另外,主 觀題的難度和答題量關(guān)系要具體而論,通常,涉及再認、再現(xiàn)歷史事實的內(nèi)容,即使文字量多,但難度不高, 賦分也較少;涉及綜合、分析、評價的內(nèi)容,即使文字量不多,但難度較高,賦分也多一些。
三、評分
一、參考答案及評分標(biāo)準(zhǔn)具有科學(xué)性和可操作性
科學(xué)性是指參考答案和評分標(biāo)準(zhǔn)無科學(xué)性錯誤,另外,亦指程度合適。對于選擇題來說,答案就是正確選 項,在設(shè)計正確選項時就要考慮到它的科學(xué)性和程度問題。程度包含難度,也包含其它的因素,如應(yīng)排除正確 選項的偏、怪現(xiàn)象以及它和干擾項的內(nèi)容是否平衡等等。
對于主觀題來說,科學(xué)性首先是指參考答案和評分標(biāo)準(zhǔn)科學(xué)合理。另外,重要的是要看參考答案是否體現(xiàn) 了一個相對完整的科學(xué)含義,是否揭示了題目各個因素之間的內(nèi)部聯(lián)系?刹僮餍允侵冈u分標(biāo)準(zhǔn)應(yīng)與參考答案 相呼應(yīng),相一致,同時又有一定程度的變通性,也就是說,評分標(biāo)準(zhǔn)對答案來說既是給分的依據(jù)又是變通的依 據(jù)。這要求評分標(biāo)準(zhǔn)的含量要大于具體的答案,要能放得開又能鎖得住。總之,評分標(biāo)準(zhǔn)應(yīng)能夠應(yīng)付對同一問 題的各種理解的表述。
二、主觀題評分既能有效地控制評分誤差,又能鼓勵考生有創(chuàng)見地答題
控制評分誤差和鼓勵有創(chuàng)見地答題是一對矛盾?刂圃u分誤差是要求在評分中盡可能具體地設(shè)想考生的各 種思路,并在評分中予以規(guī)定;鼓勵有創(chuàng)見地答題則要求題目是開放性的,但題目的開放會給評分的實施中自 然顯得不好操作,變通無依據(jù)。題目越開放,評分誤差就越難以控制,這是各科考試中遇到的普遍問題。因此 ,這條評價標(biāo)準(zhǔn)只能是相對而言,我們只能從題目在多大程度上鼓勵了考生有創(chuàng)見地答案,在評分中是否相應(yīng) 地采取了控制誤差的方法,這就是說,題目向前發(fā)展了一步,評分也要向前發(fā)展一步,二者應(yīng)該是相輔相成的 。
就歷史學(xué)科來說,控制評分誤差有幾個環(huán)節(jié)應(yīng)該抓。黄湟,題目的考查目標(biāo)要在評分中體現(xiàn)出來;其二 ,考查目標(biāo)應(yīng)被分解成得分等級,每一等級應(yīng)概括考生中的幾種答題情況;考查目標(biāo)的主體內(nèi)容應(yīng)分布各得分 等級中,主體內(nèi)容是決定基本分的主要依據(jù)。其三,構(gòu)成答題的其它因素如文字表述的邏輯聯(lián)系,對問題的展 開程度、歷史材料的運用等等也應(yīng)制定量表予以等級化。
鼓勵考生有創(chuàng)見地答題對題目的要求大致是這樣的,它應(yīng)該擺脫生硬的一問一答的模式,題目的面貌基本 上不是在提出什么需要回答的問題,而是提出一個共同討論的問題,這樣才談得上“鼓勵”!坝袆(chuàng)見”對于 題目來說,就是材料的組織更巧、問題的切入更新,使考生對已有知識能有新的組合發(fā)揮才可能“有創(chuàng)見”, 也就是說,要把教材套在題目上是無路可走的,非得“創(chuàng)見”一點不可。當(dāng)然,對于各種“創(chuàng)見”的可能性, 要給以充分估計,并體現(xiàn)在評分標(biāo)準(zhǔn)上,以免評分失去依據(jù)。
【談歷史學(xué)科的考試評價標(biāo)準(zhǔn)】相關(guān)文章:
也談學(xué)科整合08-17
談歷史材料的問題設(shè)計08-22
自我評價的標(biāo)準(zhǔn)06-03
也談歷史學(xué)科教師專業(yè)發(fā)展路徑08-19
談?wù)Z文學(xué)科的審美教育08-08
談歷史教學(xué)中的設(shè)疑08-07
談電視戲曲的歷史和現(xiàn)狀08-05