7第七章學習結果測評

上傳人：精*** IP屬地：河南上傳時間：2022-07-29 格式：DOC 頁數(shù)：21 大?。?78KB 積分：16 舉報 版權申訴

已閱讀5頁，還剩16頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、PAGE PAGE 21第七章學習結果的測量與評定第一節(jié) 概述眾所周知，學生在學校里的學習效果以及他們的智力水平和個性特征等諸方面的情況，都需通過測量來進行評定。只有運用科學的方法去進行測量，才能了解是否真正達到了預定的教學目標，才能了解學生的學習結果及其心理發(fā)展的水平，并明確教學中存在的問題，以便今后合理地組織學生進行新的學習，進一步激發(fā)他們的學習動機。因此，測量與評定作為一種手段是學校教育過程中不可缺少的一個重要環(huán)節(jié)。一、什么是學習測量與評定 (一)什么是測量和測驗測量是用數(shù)學方式對人的行為的描述。教學過程中的測量是用數(shù)學的方式對學生學習行為的描述，主要是借助于測驗來進行。測驗是通

2、過一系列的科學程序(如編制題目、施測和評分等)對學生某一方面的學習行為進行測量。例如，給一個學生班一項100個題目的測驗，其中一位學生得了70分，他的測驗分數(shù)就是一種測量，也就是對于他的作業(yè)水平的一種描述。 (二)什么是評定教學過程中的評定是根據(jù)一定的標準對學生的學習行為進行估價的過程。例如，前例中的那一位得了70分，家長問教師他屬于哪一個等級，教師說70分是乙等，這就是給這位學生的一個評定?？梢?，評定與測量有密切關系，但也有區(qū)別。評定是在測量的基礎上作出的，測量是種客觀的描述，評定是一種主觀的判斷，但主觀判斷要以客觀描述為依據(jù)，否則主觀判斷就是武斷的判斷。二、學習測量和評定的主要功能(一)

3、診斷功能測量和評定不但可以用來了解與評價學生的學習及智力發(fā)展水平，還可用來評價教師的教學，評價一個班級、一所學校或一個地區(qū)的教育、教學質量；不僅可以作跨區(qū)域的橫向比較，還可作跨年代的縱向分析。但在學校中，教師更多的是通過測量的評定來了解每個學生的學習狀況，分辨優(yōu)劣，診斷學生在知識掌握和能力發(fā)展上的不足及問題所在，以便因材施教和個別指導。 (二)反饋與鞭策功能測量與評定的反饋和鞭策功能可以從教與學這兩個方面體現(xiàn)出來。 1為教師的教學提供反饋信息教師總是以測驗為工具并通過評定從中分析自己的教學與學生的學習情況，以達到改進教學的目的。測量與評定貫穿于教學活動的各個階段。在教學開始前的摸底測驗及其

4、評定，其目的是為了把握并評定學生的現(xiàn)狀，使教師了解學生對于完成這一階段教學任務在知識、技能和智力等方面的準備情況，以便確定教育目標和教學計劃；在教學過程中的檢查測驗及訂定，可使教師掌握學生對有關知識的學習狀況及時發(fā)現(xiàn)教與學中的問題和缺陷，從而修改教學內容，改進教學方法，達到診斷學生學習上的困難和評價學生進步的目的，因此又被稱之為診斷一進步評定；教學結束后的測驗及評定，能使教師了解教學目標的完成情況，以及學生綜合運用和遷移知識、技能的水平是否提高了，以制定新的教學目標提供依據(jù)。2.激發(fā)學生的的學習動機定期的考核可以督促學生認真地對所學知識進行全面系統(tǒng)的復習，加深對教材的理解和掌握。測量與評定的

5、結果能使學生更好地了解自己，并通過自我評定找出學習中的薄弱環(huán)節(jié)，調整學習方法，提出新的努力目標。 (三)管理功能 1編班分組和升留級的依據(jù) 根據(jù)考試的成績擇優(yōu)錄取學生，并以此編班分組，是學校通常使用的方法。因為只有了解學生的教育程度和智力發(fā)展水平，才能有的放矢地開展思想教育工作；也只有通過測量及學年成績評定，才能鑒別學生在各科學習中的差異，確定其升留級等事宜，并據(jù)此向家長報告學生的學習情況。 2職業(yè)指導的作用初中和高中畢業(yè)生將面臨繼續(xù)升學或就業(yè)選擇的問題。因此，學生在校時的成績及其各方面對他們的評定，是學生、學校、用人單位幾方面共同關心的問題。學生的學習成績，可作為其學業(yè)狀況和發(fā)展方向的大概

6、標志。而有關能力傾向測驗和職業(yè)興趣測驗的運用，可以測量出學生的特殊能力和職業(yè)興趣，是他們選擇專業(yè)或職業(yè)的憑據(jù)。 3教育科學研究的工具測量對于教育理論的研究和發(fā)展具有重要意義。例如：教育心理學的理論與實踐的研究、教學方法和教材改革的研究都要以測量為手段來進行，都要通過對其教學效果的檢驗和評估來衡量，而教學效果在一定程度上又要通過測驗成績來體現(xiàn)。所有教學改革的研究和實踐，只有依據(jù)測驗成績這一數(shù)量化的指標方更有說服力。 (四)教育心理功能這是最易被忽視，但并不是最不重要的一個功能。測量和評定教育功能不只是表現(xiàn)在激發(fā)學生和教師的動機方面，它對學生和教師的自我意識，對情緒和意志也有影響。例如，肯定的

7、評定容易使學生和教師從肯定的方向看待自己，自信心開始增強，而否定的評定則可能導致師生產(chǎn)生自卑感；肯定的評定可能使師生的情緒趨于安寧，而否定的評定可能使師生的不安水準上升，以至產(chǎn)生嚴重的焦慮甚至負疚感，肯定的評定可能提高師生的積極性，有時也會使積極性下降；而有時即使是否定的評定，只要指導適當，反而會提高積極性。最后，測量和評定還會以自己特有的形式對師生的人格形成發(fā)生影響。比如，成績通知單上的成績評價，以及伴隨評價的學年末和畢業(yè)時的表彰、獎勵等，都可能對學生人格形成有好的或者不良的影響。有時候某種形式的評定，雖然對當前的教學活動有利，但從長遠的觀點看，則可能帶來不良的心理影響。三、教育工作者應具

8、備的測量與評定的知識和能力要全面深刻地掌握和使用測量和評定的理論和方法，并非專業(yè)人員所能及。標準化測驗和進行綜合評定，對于一般人來說確屬不易。但是，教育工作者應具備最起碼的，為教學所必需的評價的知識和能力：理解與清楚地表述教學和管理目標，懂得怎樣通過教學和管理活動達到目標，全面了解測量與評定的涵義及評定對教學及管理的意義。理解有效測量和評定條件，明確自己在編制、選擇和使用測量工具時所扮演的角色。能自行編制日常教學使用的測驗，能適當?shù)刂鞒譁y驗并有效地使用測驗的結果，以為改進教學和管理之用；能選擇適當?shù)臉藴驶瘻y驗。能編制、選擇與使用非測驗式的測驗工具。能綜合解釋測驗的分數(shù)和非測驗式測量

9、的結果，作出評定。明確各種測驗的用途及限制。能根據(jù)評定的結果，改進自己的教學和管理工作。此外，對參與評價的人來說，還應有高尚的人格，應當使自己參與的評定工作合乎道德規(guī)范，不應使學生或教師感到高度焦慮，損傷他們的自尊心或引起惡性競爭。四、學習評定的分類布魯姆(Bloom，BS)的分類：將評定與教學工作聯(lián)系起來，把評定分為三類：一是配置性評定，二是形成性評定，三是總結性評定。這個分類已被許多心理學家認可和采納。在我國的教學實踐中，也存在類似的情況。 (一)配置性評定一般在各學年、各學期開始時或開始前施行，其目的是要了解學生是否具有達到教學目標所必需的基礎知識和技能學生的準備狀態(tài)。通俗地講，

10、即是知道學生的底細。所謂學生的預備狀態(tài)或底細是根據(jù)他們在同年級或同年齡學生中的地位，以及各個人成績水平上的差異來衡量的。摸清情況，就可以更好地編班分組，妥當?shù)匕才沤虒W計劃等等。這種評定因而可稱為配置性評定。 (二)形成性評定一般是在教和學的過程中進行的，目的在于了解教學結果，探究教學中所存在的問題的缺陷，以便對教學工作進行調整。例如，比較同一個學生在不同學科中的成績，以及在同一學科中不同方面的成績，可以對學生提供一般的指導，還可以幫助我們進行個別教育。因為知道了學生的掌握程度，了解到他們在理解和技能等方面的缺陷，以及他們在學習上的困難，可以確定一般的指導工作和個別的補救工作，并調整課程及方法

11、，使之更切合他們的需要。形成性評定總得進行多次測試，根據(jù)多次測分的進步進行比較，可以得小學生變化或成長的指標，用以評價學生的進步及教學計劃和教學程序的效果。總之，形成性評定是通過對教牛結果的了解來調節(jié)教學工作的一種評定。由于它既能診斷學生學習的困難，又能評價學生的進步，故又被稱為診斷一進步評定。 (三)總結性評定一般在學期末進行，目的是了解學生通過學期的學習，是否達到教學目的的要求，以此作出較全面的總結性評定。典型的例子就是普遍采用的成績報告單。總結性評定具有對以后學習的預測作用。誠如某些研究表明，當前的成績往往是后來的成績的征兆。人們據(jù)此日益相信，根據(jù)學生的現(xiàn)有學習成績，可以預測將來的學習

12、成功。例如，學生在初中第一學期某門學科或某類課程的得分，可作為他以后學習該門學科或該門學科成績的預示，得分高的多半能順利地學習后來的有關科目，反之亦然。因此，總結性評定也可以提供有關編班分組等方面的資料。就這個意義來說，總結性評室是與配置性評定事實上密切聯(lián)系的。五、有效測驗的必要條件作為測驗工具的測驗或量表，是有良莠之分的。判斷一個測驗是否有效，不能只憑主觀經(jīng)驗，而要依賴客觀的標準來衡量。不管是心理測驗還是教育測驗，也不管是標準化的測驗還是教師自己編制的測驗，都要考慮效度、信度、難度、區(qū)分度等反映該測驗質量特性的重要指標，否則，這一測驗的代表性和可用性就值得懷疑。 (一)效度測驗效度是指

13、測量的真實性、正確性，即該測驗與所要測量的目標特征相符合的程度。如果一致性高，說明這個測驗的效度高，反之則低。效度所要解決的基本問題是：該測量所要達到的是什么目的?它對所要測量的特性測得有多準?例如，某智力測驗所測得的結果是“越用功的學生得分越高”，那么這個測驗實際所測的是學生“努力”的程度，而不是“智力”高低的程度。就智力測驗而言，其效度就很低?？梢姡瑢W校中常用的成績測驗也同樣要有定的效度。這類測驗主要考慮的是內容效度，就是要看該測驗能否真正按教學大綱的要求，考查出學生對所學知識的掌握情況及其能力水平。如果達不到這一目的，就像一支準星歪了不能擊中目標的槍支，失去了其應有的價值。效度通常是利

14、用該測驗的結果與一個反映測量目標的參照標準(效標)之間的相關來表示，所求得的相關系數(shù)即為效度系數(shù)。相關系數(shù)越大，說明效度越高。在學校的各科測驗中，教師對每個學生的評定值可以作為效標。如果測驗結果與教師平時對學生觀察和評定的結果一致性很高，就說明這個測驗具有較高的效度。般要求這類測驗的效度值應當在035至0.60之間。效度是測量工具必須具備的首要條件。因此在編制或使用測驗時，應該首先考慮和評鑒它的效度。 (二)信度信度是反映測驗分數(shù)的穩(wěn)定性的可靠性的指標，是指測量的前后一致性程度，只有信度高的測驗才能夠作為一個穩(wěn)定可靠的測量工具加以應用。測驗的分數(shù)難免要受到一些偶然因素的影響，由此而產(chǎn)生的

15、測量誤差稱為隨機誤差。如試題取樣不好，評分標準不一致，指導語不清楚，測驗過程受到干擾，受測者情緒緊張或身體不適等。這些偶然因素對測驗分數(shù)影響越大，測驗的信度就越低。反之，其信度越高。國外一般要求學科成績測驗的信度值要在090以上。信度值是用相關系數(shù)來表示的，又稱為信度系數(shù)。計算信度系數(shù)的方法主要有：再測法：我們用某一個測驗對相同的學生前后施測兩次，計算出這兩次測驗成績的相關就可得到再測信度；復本法：這種方法需要編制出兩套以上內容、形式、數(shù)量、難度等方面都等值的測驗，然后根據(jù)同一組學生接受兩次復本測驗的得分計算出相關系數(shù)，就可得到復本信度；分半法：當一種測驗沒有復本而且只能施測一次的情況下，通常

16、采用分半法來估計信度。這種方法是將一套測驗分成對等的兩半，根據(jù)每個人在這兩半試題中的得分所求得的相關系數(shù)即為半分信度。在學科測驗中，較多的是應用分半法和復本法來計算測驗題的信度。 (三)難度難度是指套測驗中試題的難易程度，這是用來進行題目分析和評價試題的主要指標之一。難度的計算可依據(jù)試題形式的不同采用以下兩種方法，其公式為上面的公式適用于客觀性的試題，下面的公式適用與論文式題目。難度值越小，說明通過率越低，題目就越難。好的測驗題目應當有適當?shù)碾y度，難度過高或過低對于鑒別學生的心理特性和學習成績都是無益的。教師選用何種難度的試題來組織和編制套測驗，應視測量的目的而定。難度值所反映的是相對難度

17、，而不是絕對難度。一個題目的難度除了與內容或技能本身有關外，在很大程度上還取決于題目的編制技術和受測者的知識經(jīng)驗及他們的復習準備情況。所謂難者不會，會者不難，指的就是難度的相對性。 (四)區(qū)分度區(qū)分度是測驗題目對考生水平鑒別能力的指標，是測驗題目能夠鑒別受測者水平的程度。只有當測驗題目的區(qū)分度高時，才能對學生的水平有較好的辨別能力。在這些題目上，好學生得分高，差學生得分低；而區(qū)分度低的題目，各類學生的得分沒有規(guī)律。區(qū)分度的計算多采用相關法，即以考生在某個題目上的得分與總分的相關作為該題的區(qū)分度值，相關越高，區(qū)分度越好。國外應用在教育上的標準化測驗要求優(yōu)秀題目的區(qū)分度在030以上，否則就需加

18、以改進或淘汰。區(qū)分度和難度之間有著密切的關系。一般來說，中等難度的試題對學生總體的區(qū)分度最高，而難度大的題目對優(yōu)秀學生有區(qū)分力，難度小的題目對差生有一定的區(qū)分力。因此在個測驗中，只有題目的難度分布合適，才可能把各種水平的考生最大限度地鑒別出來。這好比是一把尺子，全距越長，刻度越多，可應用的范圍才越廣，測量得也越精確。總之，難度和區(qū)分度也是衡量一個測驗優(yōu)劣約重要條件，將直接影響到測驗的效度和信度。 (五)可用性即測驗在解釋學生的能力、知識等方面有多大用處；測驗的形式與內容是否適合學生的年齡特征；測驗所花的時間和人力是否合適；以及評分是否客觀，主持測驗是否通過過特殊訓練等。如果在這些方面使人

19、不能接受，測驗的可用性就低。第二節(jié) 常用的測驗方法學業(yè)成績測驗是根據(jù)教學目的，控制、激勵和調節(jié)師生的教學活動以及鑒定教學效果的教學環(huán)節(jié)，是測量學生的學習能力和學習成績的種方法，是關于學生學習成就情況的衡量。通過測驗，教師可從中發(fā)現(xiàn)教學上的成敗，研究改進教學；學生能從中獲得矯正性信息，調整自己的學習；學校領導可了解教學的情況，采取相應的措施；學生家長也能了解子女的學習情況，配合學校指導和督促學生學習。因此，學業(yè)成績測驗是衡量教師教得如何和學生學得如何的一個標志。一、論文式測驗(一)論文式測驗的涵義及其試卷的編制和評分所謂論文式測驗，是由教師根據(jù)教學內容的要點，擇其較重要者出幾個試題，讓學生用

20、論文的方式，自由地以書面解答問題。至于試題的深淺，則視教學水平和學生的學習程度而定?；卮鹂梢允且粋€短句，也可以論述一個問題，還可以是在規(guī)定的時間內寫一篇文章。例如：“簡述明朝中后期資本主義萌芽發(fā)展的情況”， “試述明末農民戰(zhàn)爭爆發(fā)的原因、經(jīng)過及歷史意義”等等。 (二)論文式測驗的利弊 1論文式測驗的優(yōu)點論文式測驗應用甚廣，它之所以被廣泛采用，其理由如下命題省時容易論文式測驗容易進行，大多數(shù)學科都可以使用它。在使用這種方法時每一學科至多出上五六個或七八個題目就夠了，有經(jīng)驗的教師只需花幾分鐘的時間就能把題目出好，此較省時省力。由于題目較少，打印試卷也不困難，即使寫在黑板上，學生也能看清。有

21、利于測定學生的思維能力和寫作能力學生在回答問題時，必須組織自己的思想，進行有系統(tǒng)的敘述。對如何布局、如何立論、如何著筆，學生必須經(jīng)過一番斟酌。這就使得論文式測驗有利于測定學生組織各種觀點和整理各種證據(jù)的能力，構思確鑿論據(jù)的能力，批判地評價各種觀點和清楚地、令人信服地表述這些觀點的能力。這種方法甚至還為學生進行獨立性思維和創(chuàng)造性思維提供較大的余地，學生能自由地用他們自己的觀點來回答問題。了解學生的學習程度學生在回答問題時，必須將各個試題的要點進行詳細的闡述，如果答案詞意含糊，或言不盡意，或文不對題，便知道學生對這個問題的了解不深，或根本沒有了解。一般來說，在論文式測驗中，學生所做的答案不一

22、定全對，也不一定全錯，這樣就容易了解學生對諸多知識的綜合能力和掌握知識的準確程度。減少學生情境壓力在論文式測驗中，學生在思索用什么意思和詞匯來表達他所學的知識時，他沒有那種受到同班同學和老師監(jiān)督的感覺。用寫的方式回答問題，使他有機會比較清醒地主動回憶知識并表達自己的思想。論文式測驗還特別適用于在知識領域不甚穩(wěn)定、簡單的“正確答案”還找不到的情況下進行測試用。 2論文式測驗的缺點論文式測驗雖然有其應用的價值，但人們對它持有許多批評意見，甚至還有人主張要完全廢除這種考試的辦法。評分的主觀性論文式測驗的最大缺點，就是其主觀性太強，難于客觀地評分。論文式測驗因答案無法確定，所以評閱者在評分時

23、也難有客觀的標準，不論是分析評分法還是印象評分法，都是如此。教師評分幾乎完全憑著自己的主觀意見。同一個教師在兩個不同的時間對同一答案的考卷不能給予相同的評分：閱卷高興時，便會多給分數(shù)；不高興時便會少給分數(shù)，因為沒有尺度衡量，沒有法則遵行。至于不同的教師對同一答案的考卷所評定的分數(shù)，其差異更大。教師們各以自己的好惡評分，缺乏客觀標準，同一份試卷，如遇到評分嚴格的教師得分可能很低；如遇到評分寬松的教師，得分可能很高。試題缺少代表性學生學習了一年或半年的課程，在考試時僅僅只需回答五六個問題，這些試題不可能涉及到教學內容的全部，因此試題的內容既缺乏廣博性，也缺少代表性。所以學生對試題的范圍，常常作

24、投機性的猜測，而懶于進行全面的復習。問題涵義太廣泛教師用論文式測驗考察學生學習成績，往往給以籠統(tǒng)廣泛的問題，學生在回答時難有確定的范圍。如果學生的答案能符合教師的觀點，即得高分，反之則得低分。易受其他因素干擾測驗的主要目的之一，在于考察學生對某門學科的知識所能掌握的程度，而論文式測驗則往往會因其他因素而影響評分的結果。例如，文筆是否通順常常影響評閱的結果。再加之編制論文式測驗很容易，而且評分費時太多，這也會促使教師對評分持馬虎態(tài)度。 (二)論文式測驗的改進改進論文式測驗，可以從注意測驗所包含的學科內容與妥善地編寫問題兩個方面著手。問題要明確。選定某些內容的試題時，要對它們同所要達

25、到的教學日的之間的切合程度加以細致的檢驗，務使所有的問題足以揭示出學生的學習成就。采用一些可用較短篇幅回答的問題，以求取樣適當。還可用若干小問題代替一個大問題，學生可作明確的回答，教師也可作可靠的評分。事先擬好指導評分的規(guī)則和標準，其中包括可以接受的答案，并規(guī)定出這些答案的比重。這些規(guī)則和標準有利于增進評分的信度，并對影響評分客觀性的無關因素的控制起著指導的作用。不要因錯別字或語法有錯誤而扣分，除非考試是為測試這些方面而特別進行的。如果是關于某門學科的知識技能的考試，就應當以此為限。若是要測試語法、識字和寫字，那就要采用另外的測量工具。先要閱看幾份考卷，以便對考查的性質得到一個一般的觀

26、念，并用來檢查與修改評分的規(guī)則和標準。在評定一份考卷時不要知道答卷者的姓名，同時盡可能在幾乎相等的條件下評卷定分，或采取兩三個教師合評的方式。二、客觀測驗由于論文式測驗的信度較低，閱卷任務較繁重，以及評分缺乏客觀性等等，人們希望對學生學業(yè)成績的測驗以客觀性代替主觀性，以多數(shù)項目代替少數(shù)問題，以學習材料的記憶代替廣泛的論述，以意義明確的短語代替觀點模糊的虛文，以考查知識的獲得代替無的放矢的漫談，以劃一的標準評分代替?zhèn)€人的偏見評價。于是，一種新的測驗形式客觀測驗應運而生。（一）客觀測驗的涵義及其與論文式測驗的區(qū)別客觀測驗是用一些非常簡單或機械式反應來回答的測驗。其中最為人們聽熟悉的是填充

27、、正誤、多重選擇和配對等形式。最通用的那些客觀測驗項目都傾向于測量有關知識的回憶和再認，這種測驗項目簡短，答案可填一字、一句或個符號，或從許多可能的反應中選取個正確反應。埃貝爾(RLEbel)在他的教育成績測量一書中，曾特別就論文式測驗與客觀測驗在學生學業(yè)的評定方面的比較(見表71)，以見異同，分別優(yōu)劣。 (二)客觀測驗項目的形式及其編制客觀測驗與論文式測驗一樣，可由教師自行編制，并用于日常的教學。在介紹客觀測驗項目的形式之前，有必要提出編制客觀測驗的一股原則。 1編制客觀測驗的一般原則測驗要測試學科中的重要內容。教師在編制測驗時，必須重視學科的特點，其內容要針對教學的目標，并且是學生已在課

28、內外學過的壙哎觸的。必須確保測驗所反映的學科重點的比例適當，同某一課題有關的測驗項目究竟應占多少，須參照這個課題對這門學科的重要程度而定。不要采用繁瑣的項目，避免因過分強調死記硬背而妨礙有關意義和一般原理的理解。要降低測驗項目的閱讀難度，除非測驗的目的在于測最閱讀能力。測驗的項目必須測量學生的知識技能，盡可能不受他的語言能力的影響，因此，測驗的題目應用簡潔明晰的語言來表達，避免使用生疏復雜的語句，使學生易于理解。語句的措辭重在表達意思，避免雙重否定或模棱兩可的詞語，以免學生受文字的影響，而不易回答。一個項目不要為另一個項目的答案提供線索，回答某一特定項目的能力也不依靠前一項目的回答的能力。

29、一個特殊類型的所有項目都必須放在一起。正確答案的次序必須按隨機的原則來排列，要避免系統(tǒng)化的模式。必須避免引人上當?shù)膯栴}，詭詐性和欺騙性問題既可能損害測驗的真正目的，又可能影響學生的學習風氣。指導語要完整，舉例必須清楚。學生有權知道對他的要求究竟是什么，在說明任務時應使他了解和遵循指導語。測驗項目的措詞應適當，以便使學生回答問題的內容而不回答問題的形式。測驗項目的措詞對答案不應有啟示，以免真正不知道問題適當答案的學生根據(jù)測驗項目的措詞而得到正確的答案。 2客觀測驗項目的形式及其編制填充這種形式是在測驗中列有若干不完全的語句或答案，由學生填上適當?shù)淖?、詞或短語來補充完整。正誤正誤也稱是

30、非題或判斷題；這種形式是在測驗中列有若干正確或錯誤的語句，由學生來辨別或判斷是與非，正確者即在句子后括弧內作一正號；錯誤者則在句子后括弧內作一負號。選擇選擇也稱多重選擇，這種形式是在測驗中列有若干不完全的句子，每一句子后又有3至5個答案，由學生根據(jù)前面句子的意思在各備選答案中選出一個或多個正確答案，然后將選定答案前的符號填人括弧內。配對這種形式是在測驗中列有兩列詞句，由學生就前一列詞句與后一列適當?shù)脑~句互相配對。 (三)客觀測驗的利弊 1客觀測驗的優(yōu)點試題涉及教學內容的全部范圍?？陀^測驗的最明顯的優(yōu)點是問題的取樣比論文式測驗更廣泛，可涉及到教學內容的全部范圍。因此，學生對所學的內容必

31、須全面復習，而且所有的細節(jié)需注意或予以記憶，這可養(yǎng)成學生精讀的習慣；而不像論文式測驗那樣，學生可事前猜測或匆匆準備即可應試。試題簡明扼要，易于回答。評分客觀迅速。客觀測驗的形式多樣，不同形式的項目在一定程度上可以測量出學生掌握知識的不同水平和理解程度。 2客觀測驗的缺點命題費時且困難。客觀測驗的試題，其涉及的范圍很廣，題目數(shù)量很多，編制如此大量的測驗項目的任務，即使對最有經(jīng)驗的教師來說也是繁重的。偏于零星知識的記憶?？陀^測驗的內容，注重細節(jié)，要求學生記憶知識。因此，學生在準備考試時，其全部時間與精力，都費在閱讀記憶上，用不著深刻的思考，而以呆板的記憶代替靈活的思維。測驗項目為數(shù)繁多，似乎

32、包羅廣泛，但各項目所要考查的，乃是零星的知識、個別的事例。忽視教學內容全部意義的完整性，以及各部分間的連貫性，從而使學生不易養(yǎng)成有系統(tǒng)的研讀習慣，對思想的組織和文字的表達能力，都不易得到發(fā)展。不能確知學生的學習程度。由于學生在回答客觀測驗的問題時，只需填寫字、詞、短句或符號，這樣對學生是否理解教學內容，或掌握別什么程度，都無從確知。三、標準測驗標準測驗也稱標準化測驗或標準化考試，是目前國際上廣為流行的一種測驗方法。它是一種大規(guī)模的、具有統(tǒng)一標準的、按照系統(tǒng)的科學程序組織的、并對誤差作了嚴格控制的測驗。標準測驗根本不可能由教師或學校自行編制，一般由專門的考試機構編制試卷并組織實施。國外

33、很多國家的教師都用標準測驗作為評定教和學的工具，以確定學生達到所要求達到的水平的進展情況。對教師來說，如果對學生學習的進步有了客觀了解，便可更適當?shù)馗倪M教學，更有效的指導學生的學習。對教育行政人員來說，通過標準測驗比較同一學校的不同班級或不同學校學生的成績水平，便可更有力地加強領導和管理。四、心理測驗學生通過教學活動，除了學業(yè)會進步外，與學習有關的幾個變量如智力、性向、人格、興趣、態(tài)度等方面也會發(fā)生一定的變化。因此，為了增進教學效果，實現(xiàn)教學目標，教師除了必須了解學生學業(yè)成績測驗外，還應了解與教學有關的其他測驗。 (一)智力測驗教學的任務有很多，但歸納起來，主要有兩大類：一是傳授知識，二

34、是發(fā)展智力。教師可以通過學業(yè)成績測驗來測量學生掌握知識的情況。雖然學業(yè)成績測驗也可以測定一些學生的智力，但對學生智力水平的高低，通過教學后智力的發(fā)展變化情況的測量，更主要的還是依靠智力測驗。目前世界上最流行的兩種智力測驗是斯坦福一比奈智力測驗和韋克斯勒智力測驗。 1斯坦福一比奈智力測驗斯坦福一比奈智力測驗包括下列各種問題：字義、語言類推問題、適應問題、算術問題、記憶、一般常識、發(fā)現(xiàn)錯誤、圖畫、空間問題、理解等。比奈首先提出了智力年齡(MA)這一概念。它表示智力達到某一年齡水平。每個年齡組都有6個測驗項目，每個項目代表2個月的智力。和測驗時，如果個10歲的兒童通過了10歲組的全部測驗項目那

35、他的智齡就是10歲。如果他還通過了11歲組的2個測驗項目(代表4個月)和12歲組的又個測驗項目(代表2個月)，那他的智齡就是10歲6個月。推盂把智力商數(shù)(IQ)作為智力量的單位。智商表示兒童智力年齡與實際年齡之間的關系，即智齡與實際年齡之比(比率智商)。為了避免計算中的小數(shù)。將商乘以100，其公式為：智商=智力年齡/實際年齡100 但實際上，對成年人進行智力測驗用上述方法計算智商，會發(fā)現(xiàn)隨著年齡的增長，平均智力越來越低。于是一種新的智力測驗和新的計算智商的方法應運而生。 2韋克斯勒智力測驗韋克斯勒智力測驗是美國心理學家韋克斯勒(DWechsler)創(chuàng)造的，它是另一個在世界上被廣為使用的標準智

36、力測驗。它包括韋氏成人智力量表(WAIS)、韋氏兒童智力測驗表(WAIS)和韋氏學前兒童智力量表(WPPSI)3種。韋氏量表屬于成套測驗，即每一個量表都由很多分測驗組成。這些分測驗可以歸為言語的：如常識、般理解、記憶、詞匯、算術推理等；操作的：如填圖、圖片排列、積木設計、實物拼湊、形數(shù)交替、迷津等兩類。因此，測驗結果可以分別得出一個人的言語智商、操作智商和總智商3個數(shù)值。韋氏量表是運用統(tǒng)計學原理，根據(jù)對人的智力的統(tǒng)計規(guī)律遵循正態(tài)分布這一事實，計算離差智商來表示智力高低的。韋克斯勒假定，人們的智商是以平均數(shù)為100和標準差為15的正態(tài)形式分布的。因此，其計算智商的公式如下：用這種離差智商，

37、可以確定一個人的智力在同齡人當中的相對位置；診斷出他是智力落后或超常。一般認為智商在70以下屬智力落后；130以上可謂智力發(fā)展優(yōu)異。 3綜合學業(yè)性向測驗李小融、魏龍渝：教學評價，217頁，成都，四川教育出版社，1988。綜合學業(yè)性向測驗的目的在于測量學生學習各門學科能力的真實程度。這種測驗不僅可以鑒別學生能力的高低，而且也可分析比較學生能力的偏向或在各方面的能力的高低。綜合學業(yè)性向測驗包括分類性向測驗(DAT)、美國大學入學測驗(ACT)、學業(yè)性向測驗(SAT)、米勒類推測驗(MAT)以及研究生性向測驗(GRE)等。 (二)人格測驗學生行為的差異，主要表現(xiàn)在能力與人格兩個方面。所謂人格，是

38、指在個人的生理基礎上，受到家庭、伴侶、學校教育和社會環(huán)境的影響，而逐步形成的興趣、愛好、習慣、性格、態(tài)度、道德、信念等心理特征的總和。在教育上經(jīng)?？梢月牭竭@樣的說法：教育的主要目的之一是培養(yǎng)學生健全的人格，教育的主要功能之一是引導學生使其人格獲得充分的發(fā)展。這就是說，通過教與學，學生各方面的人格特征都應得到發(fā)展，或發(fā)生不同程度的變化。教師要了解學生這方面的發(fā)展和變化，可以通過人格測驗，由于人格特征復雜多樣，因而其測驗也包羅萬象。 1自陳人格測驗自陳人格測驗也稱自陳問卷，是指被測者對自己的人格，按自己的意見予以評定的一種方法。具體來說，自陳人格測驗是研究者將其所需測量的人格特征，編列許多問題，

39、每一問題陳述一種行為特征，然后印成表格分發(fā)給被測者，使其就表格上所列問題，自行作答。這種方法不要求被測者行文自述其人格特征，因為這樣不能控制測驗的變量，也難以客觀評分。因此，自陳法一般都采用客觀測驗的形式。最常見的自陳人格測驗有：明尼蘇達多相人格測驗；加利福尼亞人格測驗；莫尼問題調查表；卡姆溜人格測驗；內外向人格調查表；瑟斯頓性格測驗等。 2興趣測驗興趣是人對事物的特殊認識傾向。所謂認識傾向，即在認識過程中帶有相對穩(wěn)定的指向、趨向，能夠維持較長的時間。興趣影響學生的學習和行為，因此，測量學生的興趣，可以促使教學與職業(yè)指導的進行。在學校中經(jīng)?？梢娨恍W生對某些學科有學習潛能，卻無學習那些學

40、科的興趣，因而時常反悔，徒然浪費了時間和精力。較為著名的興趣量表有：愛德華個人興趣量表；斯特朗職業(yè)興趣量表；庫得職業(yè)興趣量表等。 3態(tài)度測驗態(tài)度是人們對人、事或物的喜好或厭惡的傾向，與其行為有著密切關系。學生對教師、校規(guī)、學業(yè)、父母或學生對學生的態(tài)度，都影響教學效果。態(tài)度的測量通常有兩方面的困難：其一是態(tài)度與行為是否經(jīng)常一致?其二是公開的態(tài)度能否代表私下的態(tài)度?如果態(tài)度歸態(tài)度，行為歸行為，則測量態(tài)度無助于了解或預測行為。若公開的態(tài)度與私下的態(tài)度是兩回事，則測量態(tài)度只能獲得個人愿意公開表達的態(tài)度傾向，因而無法了解其真正的態(tài)度意向。當然，由于情境的變化、時間的更異和個人經(jīng)驗的增加，態(tài)度可能有某種

41、程度的改變，其測量信度因而會受到影響。要測量態(tài)度，應該掌握態(tài)度所包含的因素，因而測量的因素必須與態(tài)度密切相關。測量態(tài)度應包含的因素：態(tài)度的傾向，如喜歡與否，肯定與否。態(tài)度的深度與強度，如喜歡、很喜歡、不喜歡、厭惡。態(tài)度的中心，指人格心理體系中重要的因素，包括情感、認知和行為因素。態(tài)度的外顯性，態(tài)度不能直接測量，但可以通過對人們的言語、行為以及其他方面的表現(xiàn)的測量去推斷其態(tài)度。常見的與教學有關的態(tài)度測驗有明尼蘇達教師態(tài)度測驗、各學科態(tài)度測驗和學習習慣與態(tài)度測驗等。 4價值測驗價值是人們對人、事或物所作的好壞判斷。個人認為有價值的人、事或物，容易被他所接受，也能引起他接近、了解或獲取的興趣。反之

42、，若個人無視于某人某事某物的價值，他會有意忽略或回避。價值的測量與興趣或態(tài)度的測量相似，因為三者有時很難完全區(qū)分。這方面的測驗有價值測驗、人際價值測驗和工作價值測驗。 5行為觀察使用上面介紹的幾種自陳人格測驗，經(jīng)常會遇到若干有待克服的困難。例如它需要被測者的充分合作、誠實填答和自我了解，否則，所搜集的資料不足以代表個人的典型行為或人格特征。運用行為觀察法可克服上述之不足，但還應同時結合被測者在上述幾種方法中所表示的各種特征，加以相互印證，才有一定的可靠性。一般不宜單以觀察行為來確定其人格，因為行為和人格特征不是一一對應的簡單關系，行為僅是人格的一個重要參考方面。 6投射人格測驗投射人格測驗

43、是在測驗時向被測者提供些模棱兩可的刺激，讓他在不受限制的情況下，自由地做出自己的反應，使其不知不覺地表露出入格特征。即在沒有控制的情況下，個人內在因素通過對某些刺激的反應投射出來。作為刺激物的材料有內容模糊的圖片、未完成的句子、沒有結尾的故事等。投射人格測驗的優(yōu)點在于沒有自陳測驗的令人受窘的問題，從而減少被測者的緊張心情，使他在輕松的氣氛下不自覺地“吐露”真情。投射法的使用，還可避免被測者得知測量的意圖，使他猜不出測定者要他回答些什么，故難以作假，這可使其反應較為真實可靠。屬于投射人格測驗的有：羅夏墨跡測驗、主題統(tǒng)覺測驗、兒童統(tǒng)覺測驗、文字聯(lián)想測驗和名字完成測驗等。不過，投射人格測驗的有效

44、使用，完全依賴于有經(jīng)驗的主試者，而且主試者對被測者的反應還要進行某種程度的主觀解釋，這些都需受過專業(yè)訓練的人才能勝任。第三節(jié) 常見的幾種學習評定量表正如自然科學所總結的那樣，一門可評定和測量它所研究的現(xiàn)象的學科將比那些不能夠做到這一點的學科發(fā)展得快一些。隨著測量技術的發(fā)展，人們試圖用不同的方法評定教師的教學質量。下面介紹幾種常見的評定量表形式，這幾種量表形式。被證明是在教學評價中比較重要的量表形式。一、圖示量表這種量表是將答案的定序尺度用標線的方法提出來，回答者可在標線的任何一點上劃上標記以表示自己的評定。例如，當評定項目為“任課教師課堂教學目的要求是否明確”時，可以將回答的定序尺度設計為

45、：回答者可在自己認為適當?shù)牡胤接靡?guī)定的符號表明自己的評定。如認為任課教師的教學目的要求完全不明確時可以在第1處打上；非常明確時便在第7處打上；情況一般則在第4處打上；一般偏上在第5處打上；接近非常明確時在第6處打上；般偏下在第3處打上；接近完全不明確在第二處打上等。這種圖示量表的形式，如果在中點使用0，兩端還可以表示相反的意見及不同的程度：圖示量表在定序時每一間距一定要相等，否則會使回答者發(fā)生困惑，不好答問，并會增大某些間距大的類別選答的可能性，降低間距小的類別的選答可能性。圖示量表類似于溫度計，每一刻度都可以反映出評定者對教師及其教學的看法的差異。其優(yōu)點在于設計者不必想出好多形容詞來表示

46、回答的不同程度。但是，評定者在確定選擇哪一刻度表丸；自己的意見時，準確度就不如形容詞量表。如果標線上的刻度很多，情況尤其如此。例如，要是量表的標線上有10個刻度，評定者可能覺得自己的意見是處在中間狀態(tài)，但要分清到底是5或6則很困難。這就需要在設計時十分注意刻度的數(shù)量及其區(qū)分界線的問題，使量表能恰當適合回答問題的需要。在圖示量表中，由于評定者的標記可以劃在一個按次序排列的序列的任何一點上，因此它允許有非常精確的特征分等。但是這種量表又比形容詞量表和數(shù)值量表更難于列表顯示，因而很少被用于大規(guī)模的或日常的評價方案中。二、形容詞量表這種量表在提出的問題之后，用一組序列化的形容詞或修飾短語的方式提

47、供各種不同程度的答案，回答者在每個形容詞及短語上畫圈或做上記號，以表示自己的評定。例如：極好；很好；，好；尚好；不好。完全同意；同意(或贊成)；無所謂；不同意(或反對)；完全不同意(或極反對)；無法回答。絕對正確；正確；較正確；不正確；極不正確；無法回答。很好；好；可以；不對；糟糕；無法回答。經(jīng)常；偶爾；完全不。極重要；重要；較重要；不重要；不知道。非常贊成；相當贊成；稍許贊成；難說；稍許反對；相當反對；非常反對。形容詞量表允許有與形容詞本身一樣的細微差別，如“好”與“壞”這種明顯的差別和“尚好”與“好”這樣細微的差別。重要的是，某些形容詞構成了一個明確的量表，這個量表是按照從

48、好到壞，從多到少、從不常見到常見等順序(或者相反的順序)而清楚地呈現(xiàn)的序列，相鄰的一對對形容詞之間在語義上的差別近乎相等(如不好尚好好與不好尚好極好)。因此，在缺乏相同的間隔的情況下，分析就會被限制在較低等級的、無參數(shù)的統(tǒng)計中。三、數(shù)值量表數(shù)值量表是為了克服形容詞量表不能數(shù)量化的缺點而出現(xiàn)的一種量表形式，這種量表只是簡單地把數(shù)字加在形容詞量表上，對每個等級的答案都標上分數(shù)。例如：極好(5)；很好(4)；好(3)；尚好(2)；不好(1)。完全同意(5)；同意或贊成(4)；無所謂(3)；不同意或反對(2)；完全不同意或極反對(1)。絕對正確(5)；正確(4)；較正確(3)；不正確(2)；

49、極不正確(1)。很好(5)；好(4)；可以(3)；不對(2)；糟糕(1)。經(jīng)常(3)；偶爾(2)；完全不(1)。極重要(5)；重要(4)；較重要(3)；不重要(2)；不知道(1)。這種量表由于數(shù)字的出現(xiàn)，使得它的結果更加容易被制成表格，還便于輸入電子計算機進行處理以及資料登記，使用起來也比較容易和簡便。所以在教學評價實際中，數(shù)值量表是最流行的量表之。圖示量表、形容詞量表和數(shù)值量表的主要優(yōu)點是簡單明了，主要缺點是谷易受到評定者誤差，特別是評定者的中央趨勢誤差的影響，往往把過多的教師及其教學評為中等。從而降低了評定的價值。為了避免這些誤差，教學評價工作者進行了大量的研究，提出了一些新的形

50、式。下面接著介紹行為量表和圖示量表、形容詞量表以及數(shù)值量表的變體。四、行為量表觀察教師在課堂教學時的表現(xiàn)及其行為，也可以用來評定教師及其教學，而且還可以不使教師察覺。從而獲得比較可靠的資料。教師在課堂教學時的表現(xiàn)和行為是容易觀察到的，但是要確切地記錄某個教師在某教學時間內的表現(xiàn)和行為則不那么容易了。而且教學是師生雙邊活動，除教師的表現(xiàn)和行為外，學生在課堂上的表現(xiàn)和行為也是極其重要的。若要觀察個班級的學生在課堂上的一系列行為則要費更長的時間和用更多的手續(xù)了。因此，進行行為評定的首要前提是準備或設計教學行為的量表，以此表明被評教師在這個量表中所居的位置。設計行為量表可按下面的程序進行：首先要

51、求評定者熟悉被評定的教學現(xiàn)象，而且要求他們描述其中的有效行為或無效行為。接著，研究者把這些描述分成相對來說內容較少的種類并給它們命名。作為對分類的檢查，也可組織有豐富教學經(jīng)驗的教師或教學專家及教學評價專家再次把上述描述分配到已命名的種類中。然后，評定者把可以有效地分類和評定的那些描述歸人一個為各類描述而設置的量表，使用這些對教學行為的描述作為量表的標度。例如：通過教師與學生的接觸來評定教師對教學的態(tài)度：在教師家里召開研討會。一愿意在正常的上班時間之外和學生一起活動。一一在辦公室和學校的其他地方會見學生。樂意占用辦公時間與學生交談。勉強安排最少可能的辦公時間與學生接觸。拒絕在課堂之

52、外會見學生。行為量表通常分為37個單位或等級，每個等級代表某一教學行為的一個增量。評定者根據(jù)任課教師在教學的某一方面的行為的程度不同而在量表的相應等級上做上記號。但是，設計行為量表可能是一件相當困難的事棲。目前國外也多是-些關于人格特征方面的行為量表；至于教學評價方面的行為量表，國內外都幾乎很難見到。這里介紹個關于教學評價方面的行為量表雛形供參考(見表72)。雖然這個量表還很粗糙，各個項目的等級標準不夠明確具體，評定項目也需仔細推敲等等，但也算是一個嘗試。行為評定量表的基本原理是著重于行為的精確性越強的量表，會得到越可靠和越有效的資料。但是行為評定量表在很大程度上依賴于那些最初進行評定和分

53、類的評定者，并且需要做大量的工作。而這方面的研究并不盡如人意。課堂教學評定量表（一個例子）五、常見的幾種量表形式的變體由于常見的幾種評定量表容易受到評定者誤差的影響，因此，圖示量表、形容詞量表和數(shù)值量表的三種變體也值得人們注意。 (一)加涅1974年設計的“現(xiàn)實一滿意等級量表” 加涅等人1974年設計了一種雙重目的的“現(xiàn)實一滿意等級量表”，以使評定者回答有關每一教學評定項目的兩個問題。例如： 1你如何評定任課教師的語言清晰度? (1) (2) (3) (4) (5) 從不幾乎不偶爾時常經(jīng)常 (問題) (問題) (問題) (問題) (問題、 2在這個項目中你認為哪個評定是您滿意的?

54、(1) (2) (3) (4) (51 從不幾乎不偶爾時常經(jīng)常 (問題) (問題) (問題) (問題) (問題) 第二問旨在使評定達到某個標準或水平，并對照該標準或水平解釋評定者對第一問的回答。 (二)多伊爾在1975年提出了一種雙重的“評價一重要性量表”1你怎樣評定任課教師對別人觀點的接受?(1) (2) (3) (4) (5)不好尚好好很好很好2該教師的品質對你有怎樣的重要性? (1) (2) (3)不太重要還算重要非常重要第二問旨在提供一種方法以區(qū)分問卷上各種提問的重要性。這種被項目重要性所強調的具體特征評定比起不被強調的評定來說，是全面評價更好的預言者，而且也可以提

55、供個對正在進行的教學評定項目的有效性的方便估計。 (三)第三種變體與效果評定有關學生可以通過在一門課程開始時完成的一個評定和在該課程結束時的一個類似評定；也可以通過只是在該課程結束時作出的一個雙重前一后評定；還可以通過一個下列類型的單一評定，就能夠評定他們的學習收獲：與本課程第一天的收獲相比，你現(xiàn)在怎樣評定你對該課程教學內容的掌握了很多多少少多很多現(xiàn)在更差現(xiàn)在更差現(xiàn)在更差現(xiàn)在更好現(xiàn)在更好現(xiàn)在更好這種評定形式不僅是方便的，而且也是有效的。圖示量表、形容詞量表和數(shù)值量表這些常見的評定量表在編制過程中還有一個關鍵問題，就是在量表中應當使用多少個標度點?一般來說，量表中含

56、的標度點越多，評定者對被評現(xiàn)象所作出的區(qū)分也就越準確，評定也就越可靠。但是這種可靠性的增長在達到大約10個標度點以后降低得很快。另一方面，經(jīng)驗表明，評定者經(jīng)常發(fā)現(xiàn)10個或10個以上的標度點往往很難處理，或者令人討厭，或者逗人發(fā)笑，特別是在每個標度上做標記需要牽強附會的措詞時，例如： 3 4 5 6 7 較好良好非常好非常非常好極好理想的解決辦法是使量表上的標度點數(shù)目適合于評定者，以便使評定者有良好的區(qū)別能力處理這許多標度點，并減少由有許多標度點而引起的麻煩。一個實用的解決辦法是采用雙向標度的有67個標度點的量表： 1 2 3 4 5 6 強中弱弱中強不同意不同意不同意

57、同意同意；同意也可以采用單向標度的有56個標度點的量表：1 2 3 4 5差較差一般較好好1 2 3 4 5 不好尚好好很好極好當機械評分的等級限制在1一5個以內時，用單向形式提問可能是臺乎需要的。如果這種方法不令人滿意?？梢允褂秒p向形式，即使這種方法在可靠性方面有可能出現(xiàn)稍許遺漏。六、強迫選擇量表增強評定可靠性和有效性的另一個努力是強迫選擇量表的發(fā)明。流行的強迫選擇評定形式由四個要素構成，所有要素對評定者具有同等的吸引力，但是僅有兩個要素實際上與某些測量標準有關并被評分。剩下的兩個要素因為在區(qū)分有效表現(xiàn)與無效表現(xiàn)時沒有實驗依據(jù)，而不被人們重視：一一友好的激勵人

58、的博學的善于表達的強迫選擇量表的評分是根據(jù)評定者的識別要素的總數(shù)來決定的。這種量表蘊含著這樣一種思想，即因為所有的選擇要素對評定者來說都是同等地合乎需要的，都是未知的，都是有效的和可評分的，所以評定者將不能偽造有利的或不利的平定。因此，這種量表比前面所介紹的那些常見的評定量表更能消除評定者誤差；而且強迫選擇評定與對學生的學習測量之間有明顯的相關。然而，對強迫選取量表的個通常結論是說，它們不被那些對“突如其來”的測量方法不滿的評定暫所接受。再加上它們只產(chǎn)生個單一的概括的評分，使得它們在診斷性評價中毫無用處。而且要設計這種量表也更加困難。不過，強迫選擇評定形式稍加改變就能減少評定者對它們

59、的抵制。而且，強迫選擇量表還可以通過提供各種項目群用于診斷性評價而立住腳，這些項目群應同“好的教學”的一般標準相一致。強迫選擇量表在教學評價中的潛在用途，特別是在教師人事決定方面的潛在用途，往往披低估。所以，有必要對這種方法的價值進行重新檢驗；七、綜合評定量表同量表或問卷上的綜合量表形式可以使人們利用各種量表的合乎需麥的特征。形成比只有一種單一的量表形式組成的量表或問卷更使評定者感興趣。為了利用論文的傳送可靠性和評定的定量特征，一種常用的綜合方式是在同一量表或問卷中把各種評定式提問和論文式提問結合在一起。這種方法可以由末尾有12個論文式提問的許多評定項目構成；也可以是在開端末尾有12個

60、概括評定的基本上是論文式的問卷；還可以是在整個量表或問卷中把論文式提問和評定式提問混合在一起：以使每個評定項目都有一個為進行評論、詳盡闡述、提出建議而留出的空白。在這樣的量表或問卷中，評定者可以先進行評定，然后再進行一些簡略的評論；也可以先進行論文式提問，要求評定者較詳細地回答，然后再作出評定。這樣，評定者系統(tǒng)闡述回答的過程很可能引起許多更富有內容的回答。特殊的綜合評定項目使強迫選擇量表形式對許多評定者更具有吸引力。這種形式就是人們通常使用的“四要素強迫選擇排列”，評定者除了選擇四要素中的兩個要素之外還要在一個數(shù)值量表上評定每個選好的要素友好的 1 激勵人心人 1 博學的 1 善于表達的

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

7第七章學習結果測評

文檔簡介

溫馨提示

最新文檔

評論

相關文檔