以下為劍橋大學國際考試委員會首席執(zhí)行官Michael OSullivan的演講實錄:
尊敬的各位代表,女士們,先生們:
非常榮幸受邀在今天的研討會上發(fā)言。
我所在的劍橋國際考試委員會是全球唯一仍然隸屬于大學的國際性考試機構。作為劍橋大學的一分子,我們擁有800余年歷史,面向學生的考試一直是本校工作中不可或缺的一部分。過去150年,我們還發(fā)揮了獨特的作用,為不同學習科目設計考試體系,以供世界各地的學校使用。
我們如今為160個國家和地區(qū)的1萬多所學校提供服務,不僅提供考試和得到國際認可的資格證書,還面向學校提供課程大綱、學習資料、教師培訓和支持,幫助它們?yōu)閷W生提供適合21世紀的教育。在新加坡等多個國家,我們參與提供公立學校體系中所采用的各種考試。我們的考試也在世界各地提供國際性課程的私立學校得到廣泛采用。在埃及和哈薩克斯坦等多個國家,我們幫助政府開發(fā)面向21世紀的全新課程和考試。
今天在北京探討考試可謂恰逢其時。本周末開始,中國又將有數百萬年輕人走進高考考場,面對人生中獨一無二的機會。如果成功,他們將實現自己以及父母的夢想,進入中國一流的高等學府。
讓我提醒一下諸位另一個更具歷史性的日子。今年是中國科舉考試被廢除后的第110年,這個存在了長達1,300年的考試制度曾是中國封建時代精英統(tǒng)治階層的重要遴選門檻。它也被廣泛譽為如今地球上幾乎每個國家都存在的現代公共考試制度的原型。
縱觀歷史,我們能夠感受到重大考試制度對文明和社會產生的巨大影響??婆e考試制度無疑在向整個華人世界推廣共同的文學和哲學文明方面起到了深遠的積極作用。它培育了社會流動、英才教育等概念,以及勤奮學習的重要意義。然而,科舉后來在中國飽受批判,不僅因為它缺乏對科學技術的關注,而且在一定程度上成為造就民族災難的幫兇。
相比之下,現代高考格外強調科學和文化知識。然而隨著社會的進步,對高考改革的呼聲也越來越高。許多人會問,高考是否足夠公平?高考能否真正考驗學生亟待掌握的知識?它能否培育具有國際視野的人才?并非所有人對此持肯定態(tài)度。
教育評估領域的專業(yè)人士有時傾向于認為“考什么就教什么”。這種想法很有吸引力,當您試圖推銷考試時尤其如此。但毫無疑問,這種想法是錯誤的。如果正確,那么為了使學生掌握更多知識,只要提高考試的難度就足夠了。實際上,這個錯誤在某些國家的教育部門非常普遍。
根據我的經驗,這種想法更加準確的表述是“不考就不教”。因此,我們最好謹慎地設計考試,但在規(guī)劃教育時,我們不能以考試作為起點。
劍橋認為,學校教育應該被視為課程內容、教學方法和考試評估構成的三角關系。教育的所有改進和改革必須兼顧這三方面的因素,孤立地改變其中某一個因素都將收效甚微。
教育的核心就是課程內容,即我們希望學生所學習的內容。這通常表現為某種知識和技能體系,學生不僅要掌握核心知識點,理解不同知識點之間的關聯(lián),而且能靈活運用這些知識點,展開相關的計算、分析、批評、解釋等活動。關于知識和技能哪一個更為重要,最近出現了一些無謂的爭論。事實上,我們在教育中所關注的一切事物都是技能和知識的復雜組合。閱讀是一項技能,但必須具備語言結構和詞語含義方面的知識??茖W觀察是一項技能,但必須知道如何以正確的方式尋找正確的事物。我們也許還會辯論空氣和水哪一種物質對人類生存更加重要,這與探討知識或技能哪一個在教育中更加重要如出一轍。
劍橋課程的任何科目都非常明確地闡述了所謂的“學習目標”:也就是對于學生在課程各個階段所需學習的內容的詳細描述??荚囋O計的基礎是與學習目標掛鉤的“考評目標”。借此,我們努力確??荚噷Ρ匾膶W習給予鼓勵、認可和獎勵,而非讓考試本身成為一種目的。
采用這種方式推進的影響之一就是我們的考試很難評分。舉例來說,由于化學課的學習目標包括開展科學實驗的能力,因此某些考試必須在實驗室中進行,并且通過觀察進行評分。另舉一例,針對18歲學生的歷史課學習目標包括歷史解讀,所以對學生的考評必須通過論文進行,但需要由訓練有素的考官來評分。采用這種方式對大批學生進行考核成本高昂而且困難重重,同時有關分數更正的申訴必然層出不窮,而且必須公平地加以處理。但是,我們仍然在廣泛采用這些方法,因為我們相信,與考試設計中的成本或便利相比,對有用的學習給予鼓勵和獎勵更加重要。然而,我必須承認,針對中國的高考廣泛運用此類方法也許不符合實際。在我看來,高考的規(guī)模以及至關重要的公平性,對這項考試的設計提出了諸多限制。
下面,容我說明一下對于考試的另一種常見的批評,該批評認為考試中難以評估的某些內容,例如學生的科學實踐能力或深入研究某項主題的能力, 對于教師來說卻更加易于評估。這種批評通常還包括一個觀點,即學生在考試中的表現可能隨著考試當天不可預知的原因而發(fā)生改變, 而教師卻了解學生的真正實力。對于所有此類原因,劍橋認同由教師承擔的評估在很多情況下可能比通過考試開展的評估更有效。但是,對于大學入學遴選等某些關系重大的決策,或者對于任何旨在衡量教師和學生表現的評估,我們認為依據教師對學生的考核來建立可靠的評估體系并不現實。
最后,我將簡要評述一下教育評估領域目前的兩個重大趨勢,并且思考它們對于我之前提出的問題有何意義。
首先是對所謂“21世紀技能”的評估。劍橋已經對可以找到的有關21世紀技能的所有文獻資料進行了分析解讀,并且我們自己也開展了多項研究。我們發(fā)現,盡管并非所有此類技能都真正屬于21世紀,但包括解決問題和團隊合作在內的許多技能無疑都對學生在大學和畢業(yè)之后取得成功具有重要意義。因此這樣的技能應當給予鼓勵,其中一種鼓勵方法就是在考試中進行考核,我們許多人也正在為此努力。但必須注意的是,在目前的研究階段,即使在數學的領域中,人們對“解決問題”的真正含義也沒有達成一致意見?!皥F隊合作”的準確含義同樣也沒有取得廣泛的共識。因此,我們應當謹慎地宣稱自己有能力對學生的解決問題或協(xié)作技能進行評級和打分。務必采取一種實驗性的方法。“實驗性”不僅意味著先嘗試各種事物,還意味著對某一項理論努力證偽,并在經過大量實驗表明其可能基本正確后方才予以接受。并非所有教育考試提供機構都能照此行事。
第二個趨勢是數字技術在教育評估中越來越普遍的應用。整體上,這是一個非常積極的趨勢,為將來更好、更快、更低成本、更靈敏地實施學生評估帶來了巨大潛力。例如,計算機適應性測試和虛擬現實都為教育評估開啟了新的可能性。不難想象,未來的教育和評估將100%實現數字化,劍橋已經在進行這方面的測試。
但是,如果方式不當,數字化評估也存在某些風險。其中之一是有可能出現高頻度、低成本、評分倉促的學生評估。在美國,由于主要依賴越來越頻繁的低成本標準化測驗,雄心勃勃的“No Child Left Behind”(“有教無類”)運動演變成一場災難。這種拔苗助長的方法最終分散精力,打擊士氣,在教育方面收效甚微。孩子們的學習節(jié)奏肯定不會相同,過多地檢驗這一點毫無意義,同時頻繁考核不在教學范圍中的內容無疑也毫無意義,這恰好證明了“考什么就教什么”的錯誤性。
如今借助數字化評估,對部分內容的檢驗十分簡單易行,然而如果數字化評估實施不當,另一種風險則是那些不易借助數字化方式評估的重要技能未能得到足夠檢驗。例如,針對長篇幅書面答案的高品質機器評分仍處于早期開發(fā)階段,并且在多數情況下尚無法應用于重大考試。我們應當注意的是,急于采用仍需進一步研究的數字技術,可能降低評估的質量。
最終,優(yōu)秀的考試設計取決于考試的目的,這一點必須精確清晰地加以確認。有時,同一項考試被應用于過多的不同目的:評估學生,開展遴選,評估教師和學校。一般而言,考試的目的越簡單和明確,設計得當的可能性就越大。
對于高考改革,我認為由于高考的目的非常明確,那就是中國的大學入學考試,為考試提供支持的各種現有技術也正逐步完善,因此在設計上取得顯著進步是完全有可能的。但是,出于多種原因,我認為對高考的“顛覆式”改革也許并不明智。突然的全面變革在整個社會看來必然有失公平??荚嚢l(fā)生突然的大規(guī)模變革,也將很難確定學生的表現是進步還是退步。并且任何創(chuàng)新舉措也都需要得到評估,只有在評估的基礎上,這些舉措才能進一步完善。我抱磚引玉,提出以下策略供參考:進一步明確學習目標,為考試設計提供支撐;加強研究,依據學生們在大學的學術表現,確立考試各組成部分的預測性效度;提高可選擇性,使學生能參加他們希望在大學學習的相關科目的考試,而不僅是一般性科目的考試;逐漸普及數字化評估,以改善評估的靈敏度和效率。
女士們,先生們,預祝今天在北京的重要討論取得成功!再次感謝給我這次發(fā)言的機會。
作為擁有800余年歷史的劍橋大學的一部分,劍橋國際考試委員會是全球唯一仍然隸屬于大學的非營利性國際考試機構,在過去150年中為不同學習科目設計課程和考評體系,以供世界各地的學校使用。如今劍橋國際考試委員會已為160個國家和地區(qū)的1萬多所學校提供服務,不僅提供考試和得到國際認可的資格證書,還面向學校提供課程大綱、學習資料、教師培訓和支持,幫助它們?yōu)閷W生提供適合21世紀的教育。
留學動態(tài)