第七期 2004年01月
編者的話 首頁  

放大

學習評量
>> 學生評核的趨勢 文•老柏生

  對於評核學生的學習成就,很多人都將之與測驗考試劃上等號,或者聯想起一幅學生秩序井然地坐在試場內,面對著試卷努力書寫的景象。

圖:教學歷程及反饋圖

  如果我們將教學的歷程分為幾個部分,大致上可以分為目標、課程、教學和評核。目標又可分為總目標,它是我們對教育的願景,也有因應不同學習領域或教育程度而設定的目標。課程和教學可以說是為達致上述目標而訂定的學習計劃和內容,以及如何將之實施的一種活動。再下來是評核,檢視學生是否達致預期的目標。但評核不是整個教學歷程的終結,評核的資料也不光是用作判斷學生學習成敗而加以劃分等第、安置分配的依據,它有著反饋的作用,將訊息回饋到目標、課程和教學上,接下來便是對學生進行補救教學 (如圖)

  評核是運用策略和方法,將蒐集到學生學習的訊息作有系統的分析和判斷,以表示學生在學習質量上的情況,了解學生在學習上所存在的問題,同時亦可檢視教師的教學、課程和教材的適切,以改善學生學習為趨勢。

  傳統上課程計劃和目標主要著重在知識的習得,教學活動也傾向該方面的單向灌輸,評核學生也形成了狹隘的觀念和應用了單調的方式。

  在要求學生達致的目標上,相信絕大部分教育工作者都會認同一個人應全面而均衡的發展,包括德、智、體、群、美,甚至靈育等方面。嘉納(H. Gardner)提倡多元智能理論,現在很多教育工作者都趨之若鶩,但一落到實施的層面,我們看到,智育仍是壓倒性的在學校埵絕對優勢,或是過度側重語言智能及邏輯數學智能的培訓。布魯姆(Bloom)所分的三大目標領域中,教師考核學生的也幾乎集中在認知領域內,而且也多是考量認知領域中較低的目標層次,如知識(記憶)層次。所以,記憶力強,分析力高的學生在學校的學習生活適應中是佔有利地位的,而其他創意思考型的學生、實用性思考型的學生,未必能在校取得好的成績,反而成為教師心目中的麻煩學生,或漸漸成為不受歡迎的失敗者,抹煞了他們發展所長的機會。

  前面提過,很多人將書面的測試與學生評核等同,我們知道,這類測驗考試是一種總結性評核,總結性評核是在某一單元或階段結束時進行,目的在評定學生是否達致該單元或階段的目標。當然,總結性評核的功能相當大,它可以甄別人在知識、能力、智力......等方面的差異,對選拔人才起很大的作用。但總結性評核同時也存在局限性,它雖然可以有說明、選擇的評定作用,但在學生學習過程中不斷蒐集訊息,利用這些回饋訊息發揮矯正偏差和控制教學品質,以實施補救教學的目的也許更為重要,這就是形成性評核的特色。目前,教育工作者也許應將從前太側重總結性評核的運用,轉而要對形成性評核的理念和實務多加關注和探索。

  對於測試學生在認知領域的試卷命題上也常出現一些觀念和技術上的問題,如果對命題觀念不清晰,除了考核不到學生是否已掌握所學外,也會誤導學生的學習態度和方法。

  命題原則應該顧及教學的目標和主要的教學內容兩個向度,教師一般會在其職前培訓中學習過雙向細目表的編制方法,雙向就是依據這兩個向度編制試題。若忽略了這些原則,試題的內容隨教師的態度而變化,諸如命題過淺易或過艱深,無論是具菩薩心腸(亦可能是營造其調教下“業績” )或是有難倒學生之意圖,這些都與評核之精神不符。

  此外,命題以考量學生記憶能力為主,即使是涉及分析、綜合、評鑑、創意等題目多提供標準的答案,這確實方便教師容易批改,但學生習慣以教科書上的內容為金科玉律,一字不漏地死記硬背,實難培育出學生創新應變能力。

  在過去,由於教學模式傾向單向知識的輸送,評核的方式的確與這種教學模式相吻合,但現今的教學理念以培育學生具創意、能整合不同學習內容,具批判思維的人時,命題的取向便應多滲入發揮、討論的開放性題目。

  在處理評核結果時,以往多採用常模參照的評核模式(norm-referenced evaluation),學生的學習成就以一個量化了的分數來顯示,這種評核只能說明一個人在該群體中(一班或一級)所排列的相對位置,不同的群體,彼此的分數便不能作比較,所以現在很多人提倡標準參照的評核(criterion-referenced evaluation),依據教學的目標,檢視學生達不達標或者是對所學精熟不精熟。這樣也可讓教師、學生、家長了解該生在學習過程中掌握了甚麼,哪堨X現困難,也方便教師知道從哪一點切入去輔助學生。
前述紙筆考試的不足,因為有些能力未必能以這個方式考核出來,所以,學生日常的表現,也應是考查的主要對象。

  在評核的趨勢中,實作評核(performance evaluation)開始廣受教育界的注意。傳統的紙筆測試多只能評核到學生認知方面的目標,很難測量到學生在情意態度和動作技能上的表現,實作評核正可彌補這方面的不足,讓學生在真實情境下應用其知識及能力。實作評核強調讓學生建構答案,針對傳統紙筆測試只重視結果而不重視過程,實作評核兼重這兩個方面。

  實作評核較常見的類型有:

1) 檢核表:依據教學目標先將學生應有、可觀察的具體特質及技能依序詳列,用明確的描述語句列出該技能的標準,然後由教師、家長或學生去評定學生是否符合標準,讓學生可充分了解自己的情況,並診斷出哪些地方是須改善的。

2) 評定量表:指出學生在每種學習範疇中所達到不同程度的差異,標示出如:優、良、中、有待改進(盡量使用激勵、正向的語言)等評語。其作用與檢核表相類似,主要分別在檢核表是檢查學生的某一行為或特質是否出現,而評定量表則著重某一行為或特質的程度。

3) 口語評核:如口頭報告、演講、分享,以及在課堂上師生或同學之間的互動。

4) 檔案評核(portfolio assessment ):本來這個詞源出於藝術家的作品集,現則以學生為單位製作自己的個人學習檔案,以系統的展現學生學習的歷程和成果。

  對於傳統的評核和新的評核趨勢,歸納多位學者的觀點列表對照如下:

新舊評核模式的對照表

  教師在教育事業中,扮演一個十分關鍵的角色,而其所面對的挑戰也十分大,教師如要順應這個評核的趨勢,也會遇到很多的困難,走一條頗具挑戰的路。但我們仍須思考:

  我們要培育的下一代是怎樣的人?怎樣才能了解學生的學習成就進而加以充分發揮?目前的評核模式(也包括教學方式)能否讓學生整體全面的發展?有否需要改變?而學生評核有哪些趨勢?今後應走甚麼路向?確是值得教育工作者共同去了解和探索的方向。

(作者為教育暨青年局學校督導協調員)

參考資料:
李坤崇(1999):《多元化教學評量》。台北,心理出版社。
郭玉生:《教學評量—命題技術 (認知) 》,蒐入黃政傑主編(1996a)《教學評量》。台北,師大書苑。
David Lazear(2000)著 / 郭俊賢、陳淑惠譯:《落實多元智慧教學評量》。台北,遠流。
Airasian, P.W.(1994): 《Interpreting and Using Assessment Information》(解釋及運用評估資料),蒐入《評估與測驗》,香港,朗文。
Lloyd-Jones, R.(1986):《An Overview of Assessment》(評估概覽),蒐入《評估與測驗》,香港,朗文。


教育及青年發展局