版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、心理與教育測量知識點匯總第一章 心理與教育測量概論一、名詞解釋1. 測量:依據(jù)一定的法則使用量具對事物的特征進行定量描述的過程。2. 測量的參照點:測量工作中必須有一個量的起點,這個起點就叫做測量的參照點。3. 量表:能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體就是量表。4. 心理與教育測量:依據(jù)一定的心理學(xué)和教育學(xué)的理論,使用測驗對人的心理特質(zhì)和教育成就進行定量描述的過程。5. 測驗的標準化:是編制測驗的一個重要步驟,是指測驗的編制、實施、記分以及測量分數(shù)解釋的程度的一致性。二、簡答與論述1. 簡述理性測量單位應(yīng)具備的條件?P4一是要有確定的意義,即對同一單位,所有的人的理解都是相同的,不允許作出不
2、同的解釋;二是要有相等的價值,即第一個單位與第二個單位之間的距離等于第二個單位與第三個單位之間的距離。但是在某些情況下,要具備這兩個條件是相當困難的。2. 簡述四種測量量表及其特點?P5-6命名量表,是最低水平的測量量表,它只是用數(shù)字代表事物或用數(shù)字對事物進行分類。數(shù)字只是事物的符號,沒有任何數(shù)量的意義,不能進行代數(shù)運算??蛇M行的統(tǒng)計方法有百分比、次數(shù)、眾數(shù)和X2檢驗。順序量表,是次低水平的測量量表,不僅能夠指代事物的類別,而且能夠表明不同類別的大小、等級或事物具有某種特征的程度。在順序量表中,數(shù)字只表示等級、大小和程度的順序,它既沒有相等的單位,也沒有絕對的零點,因此不能進行代數(shù)運算。可進行
3、的統(tǒng)計方法有中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)和肯德爾和諧系數(shù)等。等距量表,是較高水平的測量量表,不僅能夠指代事物的類別、等級,而且具有相等的單位,可以進行加減運算。但它沒有絕對零點,不能進行乘除運算??蛇M行的統(tǒng)計方法有平均數(shù)、標準差、積差相關(guān)系數(shù)以及t檢驗和f檢驗。比率量表,也叫等比量表,是最高水平的測量量表,除了具有類別、等級、等距的特征外,還具有絕對的零點,可進行加減乘除運算??蛇M行的統(tǒng)計方法除了與等距量表相同外,還與幾何平均數(shù)、變異系數(shù)相同。3. 論述心理與教育測量獨特的性質(zhì)?(或心理與教育測驗的特點)P7心理與教育測量是依據(jù)一定的心理學(xué)和教育學(xué)的理論,使用測驗對人的心理特質(zhì)和教育成就進行
4、定量描述的過程,其獨特性表現(xiàn)在以下幾方面:心理與教育測量依據(jù)的法則在很大程度上只是一種理論,很難達到如同物理測量依據(jù)的法則那樣普遍被人們接受的水平。心理與教育測量的對象是人的心理特質(zhì)和教育成就。教育成就的含義比較明顯,是指一個人通過接受教育而獲得的知識水平。心理特質(zhì)的含義比較含混,不大能夠給予清楚的界定。這就決定了心理與教育測量只能是一種間接測量。心理與教育測量的量具是由有關(guān)領(lǐng)域的專家編制,經(jīng)過長期的試用、修訂、完善而逐漸形成的標準化測驗。心理與教育測量的目標雖然是對人的心理特質(zhì)和教育成就進行定量分析,但這種定量分析的精確度遠不及物理測量的精確度高。4. 論述心理與教育測量究竟是否必要和是否可
5、能?P8(1)我國古代學(xué)者孟子早在兩千多年前就給予了明確的并且是肯定的回答。(2)1918年,桑代克提出“凡客觀存在的事物都有其數(shù)量”,1939年,麥柯爾指出“凡有其數(shù)量的事物都可以測量”,這兩個命題被公認為是心理與教育測量的理論基礎(chǔ)。(3)從辯證唯物主義的觀點看,任何事物都是質(zhì)和量的統(tǒng)一,事物的質(zhì)的差異是分類的前提,而事物的量的差異則是測量的前提。根據(jù)這一前提,我們認為:人的心理現(xiàn)象和知識水平如同其他一切物理現(xiàn)象一樣是有差異的,這種差異不僅包括質(zhì)的方面,也包括量的方面。因為有差異,所以有必要測定差異的數(shù)量,描述差異的程度。心理特質(zhì)和知識水平雖然不是物理實體,不能直接測量,卻必然要表現(xiàn)于人的外
6、部行為之中,并調(diào)節(jié)著人的外部行為。因此,通過觀察人的外部行為的差異就有可能測量出人的心理特質(zhì)和知識水平的差異。心理與教育測量的準確性、可靠性和精確度如同其他一切測量技術(shù)一樣是相對的,也同其他一切測量技術(shù)一樣必然隨著科學(xué)技術(shù)的進步和發(fā)展而逐步提高。5. 為什么從本質(zhì)上講,心理與教育測量的量表屬于順序量表?P8-9(1)從所使用的參照點來說,教育測量與心理測量的領(lǐng)域的參照點均為相對參照點。(2)從所使用的單位來說,教育和心理測量的單位遠沒有其他測量的單位成熟和完善。教育與心理測量所使用的單位的意義不太明確。在教育與心理測量中的單位常常不等值。這就決定了心理與教育測量的量表不是直接的等距量表。6.
7、測驗標準化應(yīng)具備的條件(或測驗標準化的內(nèi)容是什么)P10-11(1)測驗內(nèi)容的標準化。標準化的首要前提,是所有接受測量的個人實施相同的或等值的測驗內(nèi)容。測驗內(nèi)容不同,所測得的結(jié)果便沒有可比較的基礎(chǔ)。(2)施測條件的標準化。標準化的第二個條件,是所有接受測量的個人必須在相同的施測條件下接受測驗。包括:相同的施測條件、相同的指導(dǎo)語、相同的測驗時限。(3)評分規(guī)則的標準化。評分規(guī)則的標準化要求評分結(jié)果具有客觀性,只有當評分的結(jié)果具備了客觀性,才能將測量分數(shù)的差異歸之于個人心理特質(zhì)和知識水平的差異。(4)測驗常模的標準化。編制測驗的一個重要步驟是編制測驗的常模。7. 簡答個別測驗的優(yōu)缺點?P13優(yōu)點:
8、主試對被試的做題行為有仔細的觀察,有機會獲得測量分數(shù)之外的信息。主試與被試面對面交流的機會更多,容易與被試建立起融洽的合作關(guān)系。對于一些特殊被試(如幼兒、文盲),只能采用個別測量,以便主試代替被試記錄其行為反應(yīng)。缺點:費時間,難以在短時間內(nèi)收集大量的測量資料。測量手續(xù)比較復(fù)雜,需經(jīng)過較高水平訓(xùn)練的人擔任主試。8. 論述心理與教育測驗的功能?P15-17(1)理論研究功能收集研究資料建立和檢驗理論假設(shè)實驗分組(2)實際應(yīng)用功能選拔人才人員安置心理診斷描述評價心理咨詢第二章 心理與教育測量的產(chǎn)生與發(fā)展簡答與論述1. 中國古代心理與教育測量思想的特點?P26中國古代社會的心理與教育測量思想都是描述性
9、的,是非定量的。這當然和當時的整個科學(xué)技術(shù)水平是相適應(yīng)的。 中國古代社會的心理與教育測量是分類式的。就能力測量和成就測量(即科舉考試)而言,分成高、中、低幾個層次;就性格測量而言,分成若干種類型。在中國古代社會的心理與教育測量思想中注重對人作整體的鑒定和評價,并傾向于和人的道德品質(zhì)聯(lián)系起來。中國古代社會的心理與教育測量思想與教育中的因材施教及人才使用有著密切的聯(lián)系,它一開始就具有強烈的應(yīng)用性質(zhì)。2. 簡述心理與教育測量的當代趨勢?p33由于信息加工心理學(xué)的興起,測量學(xué)界傾向于將實驗法和測驗法相結(jié)合,產(chǎn)生了信息加工測驗。由于計算機技術(shù)的迅速發(fā)展,傳統(tǒng)的紙筆測驗逐漸被電腦程序測驗所取代,從而大大提
10、高了測驗的效率。針對經(jīng)典測驗理論(即真分數(shù)理論)的某些缺陷,提出了一些新的測量理論,尤其是項目反應(yīng)理論和概化理論,不僅在理論上取得了巨大成就,而且在應(yīng)用上顯示出強大的生命力。第三章 經(jīng)典測驗理論的基本假設(shè)一、名詞解釋1. 測量誤差:是在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準確或不一致的測量效應(yīng)。2. 隨機誤差:是那種由與測量目的無關(guān)的、偶然因素引起的而又不易控制的誤差。3. 系統(tǒng)誤差:是那種由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。4. 真分數(shù):反映被試某種心理特質(zhì)真正水平的那個數(shù)值叫做該特質(zhì)的真分數(shù)。二、簡答與論述1. 簡述心理特質(zhì)的含義?P38-39表現(xiàn)在一個人
11、身上所特有的相對穩(wěn)定的行為方式為人的心理特質(zhì),可從以下幾方面理解:特質(zhì)是一組具有內(nèi)部相關(guān)的行為的概括,具有一定的抽象性。特質(zhì)是“一種一般的神經(jīng)心理系統(tǒng)它可以綜合不同的刺激,使人對這些刺激作出相同的反應(yīng)”。特質(zhì)是一個人身上比較穩(wěn)定的特點。一個人的精神面貌(人格)是由多種特質(zhì)分多個層次有機組合而成的。特質(zhì)可以決定一個人對特定刺激的反應(yīng)傾向,可以對人的行為進行某種預(yù)測。2. 簡述測量誤差的來源?P41心理測量的誤差來自3個方面,即測量工具、被測對象和施測過程。在測量工具方面,心理測量與物理測量有所不同。心理測量工具通常是一套以測驗(問卷)為核心的刺激反應(yīng)系統(tǒng)(通常稱作量表)。當量表在測查人的某種心理
12、特質(zhì)時,若項目所測的東西與我們預(yù)測的目的之間出現(xiàn)偏差(如項目取樣太少或太偏),則測量會出現(xiàn)誤差。在被測對象方面,造成測量誤差的主要原因是受測者真正水平是否得到正常發(fā)揮。一般地,受測者的某種心理特質(zhì)水平是相對穩(wěn)定,但是他在接受測量時的心理和生理狀態(tài)會影響其水平的正常發(fā)揮。在施測過程方面,產(chǎn)生測量誤差的原因主要是一些偶然因素(恒定因素較易控制)。比如,在物理環(huán)境方面:實測現(xiàn)場的溫度、光線、聲音、桌面好壞、空間闊窄等會造成誤差。在主試者方面:主試者的年齡、性別、外表及其施測時的言談舉止、表情動作、是否按規(guī)定實施測驗等也會造成誤差。此外,評分計分環(huán)節(jié)也是容易出現(xiàn)差錯的地方。還有,若是出現(xiàn)意外干擾(如考
13、場突然停電、有人作弊、計時表停了、試卷印刷或裝訂出錯等),則同樣會讓考生分心或造成考場混亂,導(dǎo)致測量誤差。3. 簡述真分數(shù)(或CTT)的數(shù)學(xué)模型及其假設(shè)?P42既然觀察分數(shù)很難等于真分數(shù),那兩者之間是個什么關(guān)系呢?經(jīng)典測驗理論假定,觀察分數(shù)(記為X)與真分數(shù)(T)之間是一種線性關(guān)系,并只相差一個隨機誤差(記之為E)。即:X=T+E 這就是CTT的數(shù)學(xué)模型。根據(jù)這一模型,引申出三個相關(guān)聯(lián)的假設(shè)公理:(1)若一個人的某種心理特質(zhì)可以用平行的測驗反復(fù)測量足夠多次,則其觀察分數(shù)的平均值會接近于真分數(shù)。即(X)=T 或(E)=0(2)真分數(shù)和誤差分數(shù)之間的相關(guān)為零。即(T,E)=0(3)各平行測驗上的誤
14、差之間相關(guān)為零。即(E1,E2)=0第四章 測量信度一、名詞解釋1. 信度定義:多次測量的結(jié)果間的一致性程度就叫信度,有時也叫測量的可靠性。2. 重測信度:指的是用同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度,其大小等同于同一組被試在兩次測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。公式為:rxx=(x-?x)(y-?y)/(x-?x)2(y-?y)23. 復(fù)本信度:指的是兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度,其大小等于同一批被試在兩個復(fù)本測驗上所得分數(shù)的皮爾遜積差相關(guān)系數(shù)。4. 分半信度:指的是將一個測驗分成對等的兩半后,所有被試在這兩半上所得分數(shù)的一致性程度。5. 同質(zhì)性信度:也叫
15、內(nèi)部一致性信度,是指測驗內(nèi)部所有題目間的一致性程度。6. 評分者信度:指的是多個評分者給同一批人的答案進行評分的一致性程度。二、簡答與論述1. 簡述信度的作用?P46-47(1)信度是測量過程中所存在的隨機誤差大小的反應(yīng)。(2)信度可以用來解釋個人測驗分數(shù)的意義。(3)信度可以幫助進行不同測驗分數(shù)的比較。2. 簡述信度的五種估計方法及其使用的前提條件?P48-53(1)重測信度。它必須滿足三個條件:所測量的心理特性必須是穩(wěn)定的。遺忘和練習(xí)的效果基本上相互抵消。在兩次施測的間隔期內(nèi),被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練。這一點,實際上也是要保證被試具有穩(wěn)定的心理特質(zhì)。(2)復(fù)本信
16、度。條件之一是首先要構(gòu)造出兩份或兩份以上真正平行的測驗(即A、B卷)。條件之二是被試要有條件接受兩個測驗。這種條件主要取決于時間、經(jīng)費等幾個方面。另外,在報告結(jié)果時,應(yīng)報告兩次施測的間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。(3)分半信度。通常是在只能施測一次或沒有復(fù)本的情況下使用。而且,在使用斯皮爾曼布朗公式時要求全體被試在兩半測驗上得分的變異數(shù)要相等。當一個測驗無法分成對等的兩半時,分半信度不宜使用。(4)同質(zhì)性信度。(5)評分者信度。3. 論述影響測量信度的主要因素?P55-56被試方面。就單個被試而言,被試的身心健康狀況、應(yīng)試動機、注意力、耐心、求勝心、作答態(tài)度等會影響測量誤差。就被試團體而
17、言,整個團體內(nèi)部水平的離散程度以及團體的平均水平都會影響測量信度。主試者方面。就施測者而言,若他不按指導(dǎo)手冊中的規(guī)定施測,或故意制造緊張氣氛,或給考生一定的暗示、協(xié)助等,則測量信度會大大降低。就閱讀評分者而言,若評分標準掌握不一,或前緊后松,甚至是隨心所欲,則也會降低測量信度。施測情境方面。在實施測驗時,考場是否安靜、光線和通風(fēng)情況是否良好、所需設(shè)備是否齊備、桌面是否合乎要求、空間闊窄是否恰當?shù)榷伎赡苡绊懙綔y量的信度。測量工具方面。以測量為代表的心理與教育測量工具是否性能穩(wěn)定是測量工作成敗的關(guān)鍵。一般地,試題的取樣、試題之間的同質(zhì)性程度、試題的難度等是影響測驗穩(wěn)定性的主要因素。兩次施測的間隔時
18、間。在計算重測信度和穩(wěn)定性與等值性系數(shù)(復(fù)本信度之一)時,兩次測驗相隔時間越短,其信度值越大;間隔時間越長,其他因素帶來影響的機會就多,因而其信度值就可能越小。4. 簡述提高測量信度的常用方法?P56-57(1)適當增加測驗的長度。(2)使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平。(3)努力提高測驗試題的區(qū)分度。(4)選取恰當?shù)谋辉噲F體,提高測驗在各同質(zhì)性較強的亞團體上的信度。(5)主試者嚴格執(zhí)行實測規(guī)程,評分者嚴格按標準給分,實測場地按測驗手冊的要求進行布置,減少無關(guān)因素的干擾。第五章 測量信度一、名詞解釋1. 效度:指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。2. 內(nèi)容效
19、度:指一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。3. 結(jié)構(gòu)效度:指一個測驗實際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測驗分數(shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。4. 實證效度:指一個測驗對處于特定情境中的個體的行為進行估計的有效性。5. 效標:是衡量一個測驗是否有效的外在標準,它是獨立于測驗并可以從實踐中直接獲得我們所感興趣的行為。6. 效標測量:我們所感興趣的行為往往是一個觀念上的東西(觀念效標),它必須用一個數(shù)字或等級來進行表達,即效標測量,它具有多樣性、復(fù)雜性、特殊性和時間性。二、簡答與論述1. 簡述對效度概念的認識與理解?P59-60(1)效度是一個相對的概
20、念。表現(xiàn)在兩個方面:效度是相對于一定的測量目的而言的。心理特質(zhì)是較隱蔽的特性,只能通過他的行為表現(xiàn)來進行推測,因此,心理測量不可能達到百分之百的準確,而只能達到某種程度上的準確。(2)效度是測量的隨機誤差和系統(tǒng)誤差的綜合反映。(3)判斷一個測量是否有效要從多方面搜集證據(jù)。2. 簡述效度與信度的關(guān)系?P61 根據(jù)公式SX2=SV2+SI2+SE2 ,可以得到信度與效度的關(guān)系如下:(1)信度高是效度高的必要而非充分的條件。當隨機誤差的變異數(shù)SE2減小時,真實分數(shù)的變異數(shù)ST2增加,測驗信度ST2 / SX2隨之提高。信度的提高只給有效變異數(shù)SV2的增加提供了可能,至于是否能提高效度,還要看系統(tǒng)誤差
21、變異數(shù)SI2的大小??梢姡哦雀卟灰欢ㄐФ雀?。但一個測驗要想效度高,真分數(shù)的變異數(shù)必須占較大的比重,即測驗的信度必須高。(2)測驗的效度受它的信度制約。根據(jù)效度和信度的定義(rxy2= SV2 / SX2 ,rxx= ST2 / SX2 )以及公式(ST2=SV2+SI2)可得。3. 簡述內(nèi)容效度及其應(yīng)用范圍?P62指一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。估計一個測驗的內(nèi)容效度就是去確定該測驗在多大程度上代表了所要測量的行為領(lǐng)域。這里,所要測量的內(nèi)容或行為領(lǐng)域是依據(jù)測量目的而定的,它通常包括欲測的知識范圍,以及該范圍內(nèi)各知識點所要求掌握的程度兩個方面。內(nèi)容效度主要應(yīng)用于成就測驗
22、,因為成就測驗主要是測量被試掌握某種技能或?qū)W習(xí)某門課程所達到的程度。內(nèi)容效度也適合于某些用于選拔和分類的職業(yè)測驗。這種測驗所要測的內(nèi)容就是實際工作所需的知識和技能,編制這種測驗應(yīng)首先對實際工作作較細的分析,否則,題目取樣的代表性就難以令人滿意。需要注意的是,內(nèi)容效度不適合用于能力傾向測驗和人格測驗。此外,要避免與表面效度相混淆。4. 簡述內(nèi)容效度的確定方法?P62-63(1)主要是邏輯分析法,其工作思路是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的吻合程度做出判斷。其具體步驟是:明確欲測內(nèi)容的范圍,包括知識范圍和能力要求兩個方面。這種范圍的確定必須具體、詳細,并要根據(jù)一定目的的規(guī)定好各綱目的比例。確定
23、每個題目所測的內(nèi)容,并與測驗編制者所列的雙向細目表(考試藍圖)對照,逐題比較自己的分類與制卷者的分類,并做記錄。制作評定量表,考察題目對所定義的內(nèi)容范圍的覆蓋率、判斷題目難度與能力要求之間的差異,還要考察各種題目數(shù)量和分數(shù)的比例以及題目形式對內(nèi)容的適當性等,對整個測驗的有效性做出總的評價。(2)統(tǒng)計分析方法。具體方法是:從同一個教學(xué)內(nèi)容總體中抽取兩套獨立的平行測驗,用這兩個測驗來測同一批被試,求其相關(guān)。若相關(guān)低,則兩個測驗中至少有一個缺乏內(nèi)容效度;若相關(guān)高,則測驗可能有較高的內(nèi)容效度(除非兩個測驗取樣偏向同一個方面)。(3)再測法。操作過程是:在被試學(xué)習(xí)某種知識之前作一次測驗(如學(xué)習(xí)電學(xué)之前考
24、電學(xué)知識),在學(xué)過該知識后再作同樣的測驗。這時,若后側(cè)成績顯著地優(yōu)于前測成績,則說明所測內(nèi)容正是被試新近所學(xué)內(nèi)容,進而證明該測驗對這部分內(nèi)容而言具有較高的內(nèi)容效度。5. 簡述結(jié)構(gòu)效度的含義、特點及應(yīng)用范圍?P63(1)含義:結(jié)構(gòu)效度是指一個測驗實際測到所要測量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測驗分數(shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。(2)特點:結(jié)構(gòu)效度的大小首先取決于事先假定的心理特質(zhì)理論。當實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測驗結(jié)構(gòu)效度不高,因為還有可能出現(xiàn)理論假設(shè)不成立,或者該實驗設(shè)計不能對該假設(shè)作適當?shù)臋z驗等情況。這就使得結(jié)構(gòu)效度的獲取更為困難。結(jié)構(gòu)效度
25、是通過測量什么、不測量什么的證據(jù)累積起來給以確定的,因而不可能有單一的數(shù)量指標來描述結(jié)構(gòu)效度。(3)應(yīng)用范圍:結(jié)構(gòu)效度主要用于智力測驗、人格測驗等一些心理測驗方面。6. 論述結(jié)構(gòu)效度的確定方法?P64總的來說,結(jié)構(gòu)效度的確定一般包括3個步驟:提出理論假設(shè),并把這一假設(shè)分解成一些細小的綱目,以解釋被試在測驗上的表現(xiàn)。依據(jù)理論框架,推演出有關(guān)測驗成績的假設(shè)。用邏輯的和實證的方法來驗證假設(shè)。具體地說,結(jié)構(gòu)效度的估計可以有以下一些方法:(1)測驗內(nèi)部尋找證據(jù)法。首先,我們可以考察該測驗的內(nèi)容效度,因為有些測驗對所測內(nèi)容或行為范圍的定義或解釋類似于理論構(gòu)想的解釋,所以,內(nèi)容效度高實質(zhì)上也說明結(jié)構(gòu)效度高。
26、其次,我們可以分析被試的答題過程。若有證據(jù)表明某一題目的作答除了反映所要測的特質(zhì)以外,還反映其他因素的影響,則說明該題沒有較好地體現(xiàn)理論構(gòu)想,該題的存在會降低結(jié)構(gòu)效度。再次,我們足可以通過計算測驗的同質(zhì)性信度的方法來檢測結(jié)構(gòu)效度。若有證據(jù)表明該測驗不同質(zhì),則可以斷定該測驗結(jié)構(gòu)效度不高。當然,測驗同質(zhì)只是結(jié)構(gòu)效度高的必要條件。(2)測驗之間尋找證據(jù)法。首先,我們可以去考察新編測驗與某個已知的能有效測量相同特質(zhì)的舊測驗之間的相關(guān)。這種方法叫相容效度法。其次,我們也可以去考察新編測驗與某個已知的能有效測量不同特質(zhì)的舊測驗間的相關(guān)。這種方法也叫區(qū)分效度法。再次,我們還可以通過因素分析的方法來了解測驗的
27、結(jié)構(gòu)效度。(3)考察測驗的實證效度法。有兩種做法:其一是根據(jù)效標把人分成兩類,考察其得分的差異。其二是根據(jù)測驗得分把人分成高分組和低分組,考察這兩組人在所測特質(zhì)方面是否確有差異。(4)多種特質(zhì)多種方法矩陣法。該方法實質(zhì)是相容效度和區(qū)分效度法的綜合運用。7. 實證效度的含義、種類、作用及確定方法?P66-68(1)含義:實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的有效性。也就是說,一個測驗是否有效,應(yīng)該以實踐的效果來作為檢驗標準。實證效度又稱效標關(guān)聯(lián)效度。(2)種類:根據(jù)效標資料搜集的時間差異,實證效度可以分成同時效度和預(yù)測效度兩種。 (3)作用:同時效度主要用于診斷現(xiàn)狀,在于用更
28、簡單、更省時、更廉價和更有效的測驗分數(shù)來取代不易搜集的效標資料。預(yù)測效度的作用在于預(yù)測某個個體將來的行為。無論是同時效度還是預(yù)測效度,其目的都是想通過對測驗在一個有代表性的樣本上,用實證的方法來證明測驗有效,于是在今后就可以用簡便的測驗去預(yù)測類似于樣本的其他團體或個體的行為。 (4)確定方法:大體上可以分為一下幾個步驟:明確觀念效標。確定效標測量??疾鞙y驗分數(shù)與效標測量的關(guān)系。從效度估計的方法上看,實證效度可以用一下方法進行估計:相關(guān)法。計算測驗分數(shù)與效標測量的相關(guān)系數(shù)(積差相關(guān)系法、等級相關(guān)法、二列相關(guān)法、四分相關(guān)法等)。區(qū)分法。被試接受測驗后,讓他們工作一段時間后,再根據(jù)工作成績(效標測量
29、)的好壞分成兩組,這時再回過頭來分析這兩組被試原先接受測驗的分數(shù)差異,若這兩組人的測驗分數(shù)差異顯著,則說明該測驗有較高的效度。命中率。當用測驗作取舍決策時,決策的正命中率和總命中率是測驗有效性的較好指標。8. 論述影響測量效度的因素?P69-70測驗的構(gòu)成。當組成測驗的試題樣本沒有較好地代表欲測內(nèi)容或結(jié)構(gòu)時,測量的內(nèi)容效度或結(jié)構(gòu)效度必然會不高。同時,若題目語義不清、指導(dǎo)語不明、題目太難或太易、題目太少或安排安排不當?shù)?,都會降低測量效度。一般而言,增加測驗的長度可以提高測量信度,進而為提高測量效度提供了可能。測驗的實施過程。一個測驗在實施過程中,如不遵從指導(dǎo)語的要求,或出現(xiàn)意外干擾,或評分、計分
30、出現(xiàn)差錯等,都會降低測量效度。接受測驗的被試。一般情況下,被試的應(yīng)試動機、情緒、態(tài)度、身體狀態(tài)等,都會影響測量信度,造成較大的隨機誤差,進而影響測量的效度。就整個團體而言,如果缺乏必要的同質(zhì)性,則很可能會得到不恰當?shù)男Ф荣Y料。所選效標的性質(zhì)。由于同一個測驗可以有不同的效標,同一個觀念效標也可以有不同的效標測量,因此在評價測量效度時,所選效標的性質(zhì)是很重要的考慮因素。測量的信度。測量信度是測量隨機誤差的反映,而任何誤差的增加,都會降低測量的信度,所以在考察測量效度時,一定要注意測量信度。9. 論述提高測量效度的方法?P70 要想提高測量效度,就必須設(shè)法控制隨機誤差、減小系統(tǒng)誤差,同時,還要選擇好
31、特別恰當?shù)男?,把效度系?shù)準確地計算出來。具體來說,下述方法能提高測量效度:精心編制測驗量表,避免出現(xiàn)較大的系統(tǒng)誤差。這就要求題目樣本能較好地代表欲測內(nèi)容或結(jié)構(gòu),要避免出現(xiàn)題目偏倚。同時,題目的難易程度、區(qū)分度、也要恰當,題目的數(shù)量也要適中。此外,測驗試卷的印刷、題目作答的要求、評分計分的標準、題目意思的表述等,都必須嚴格檢查,避免一切可避免的誤差的出現(xiàn)。妥善組織測驗,控制隨機誤差。測驗實施者一定要嚴格按手冊指導(dǎo)語進行操作,要盡量減少無關(guān)因素的干擾。創(chuàng)設(shè)標準的應(yīng)試情境,讓每個被試都能發(fā)揮正常的水平。應(yīng)讓被試調(diào)整好應(yīng)試心態(tài),讓他們從生理上、心理上、學(xué)識上等做好應(yīng)有的準備。否則,焦慮因素和其他無關(guān)
32、因素影響過大,必然會降低測量效度,測不到欲測的內(nèi)容或結(jié)構(gòu)。選好正確的效標,定好恰當?shù)男藴y量,正確地使用有關(guān)公式。在評價一個測驗是否有效時,效標的選擇是一個重要方面。假若所選效標 ,或所選效標無法量化,則很難正確地評估出測量的實證效度。如果效標及效標測量都合乎要求,則公式的選擇是影響估計的另一個重要方面。第六章 測驗的項目分析一、名詞解釋1. 難度:指測驗項目的難易程度。2. 區(qū)分度:是指測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力。3. 鑒別度指數(shù):當效標成績是連續(xù)變量時,可以從分數(shù)分布的兩端個選擇27的被試,分別計算出每道題目上各自的通過率,兩者只差就是鑒別度指數(shù)(D)即:D=PH-PL,式中
33、PH和PL分別是高分組和低分組在該項目上的通過率。 二、簡答與論述1. 難度的計算方法 p72(1)二分法記分項目的難度。通過率。如果不考慮被試作答是猜測成功的機遇,二分法記分測驗項目的難度通常以通過率來表示,即以答對或通過該項目的人數(shù)的百分比來表示。P=R/N,式中,P代表項目難度,N為全體被試數(shù),R為答對通過該項目的人。極端分組法。當被試人數(shù)較多時,則可以先將被試依照測驗總分從高到低排列,分成三組,總分最高的27被試稱為高分組(NH),總分最低的27被試稱為低分組(NL),分別計算高分組和低分組的通過率,然后求項目的難度。P=(PH+PL)/2或P=(RH/NH+RL/NL)/2,式中,P
34、H、PL分別表示高分組和低分組的通過率;RH、RL分別表示高分組和低分組通過該項目的人數(shù);NH、NL分別代表高分組和低分組的人數(shù)。(2)非二分法幾分項目的難度。對于論述題,每個項目不止有答對和答錯兩種可能結(jié)果,而是從滿分至零分之間有多種可能結(jié)果。對于這類項目,常常用下面的公式來計算其難度。P=?x/xmax 式中?x為被試在某一項目上的平均得分,xmax為該項目的滿分。2. 如何確定測驗的難度水平?P74 進行難度分析的主要目的是為了篩選項目,項目的難度水平多高合適,取決于測驗的目的、項目形式以及測驗的性質(zhì)。 教育工作或?qū)嶋H工作中,若測驗的目的是為了了解被試在某方面知識技能的掌握情況,可以不必
35、過多地考慮難度,只要教育者認為重要的內(nèi)容就可以選用,甚至那些100通過或通過率為零的項目都可以采用。如果測驗的目的是用于選拔、錄用人員,就應(yīng)該將項目的難度控制在接近錄取率左右,即較多地采用那些難度值接近錄取率的項目。3. 簡述難度對測驗的影響?P76(1)測驗難度影響測驗分數(shù)的分布形態(tài)。測驗的難度直接依賴于組成測驗項目的難度。通過考察測驗分數(shù)的分布,可以對測驗的難度作出直觀分析。若測驗項目的難度普遍較大,被試的得分普遍較低,使得測驗分數(shù)集中在低分端,其分數(shù)分布呈現(xiàn)正偏態(tài);當測驗題目的難度普遍較小,被試的得分普遍較高,測驗分數(shù)集中在高分端,分數(shù)分布呈現(xiàn)出負偏態(tài)。測驗難度過大或過小,都會造成測驗分
36、數(shù)偏離正態(tài)分布。(2)測驗難度影響測驗分數(shù)的離散程度。過難或過易的測驗,會使測驗分數(shù)相對地集中在低分端或高分端,從而使得分數(shù)的全局縮小。項目的難度以集中在0.50左右最佳,以集中兩極端最差。4. 簡述區(qū)分度與難度的關(guān)系?P83難度與區(qū)分度有著密切的聯(lián)系。以鑒別度指數(shù)D為例,難度越接近0.50,項目潛在的區(qū)分度越大,而難度D越接近1.00或0時,項目的潛在區(qū)分度越小。這也是人們的在常模參照測驗中,要求項目保持中等難度的道理之一。實際測驗中,一般各種項目之間都具有某種程度的相關(guān),考慮到這一點,我們在利用項目分析選擇試題時,應(yīng)使項目的難度分布廣一些,梯度大一些,使整個測驗的難度分布呈正態(tài)分布,且平均
37、水平保持在0.50左右。這樣才能把各種水平的人都區(qū)分開來,并且區(qū)分得比較細。5. 區(qū)分度的相對性與什么有關(guān)?P85(1)不同的計算方法,所得區(qū)分值不同。(2)樣本容量大小影響相關(guān)法區(qū)分度值的大小。一般來說,樣本容量越小,其統(tǒng)計值越不可靠。所以在計算出r值后,不能僅從 數(shù)值大小判斷試題的優(yōu)劣。而應(yīng)運用統(tǒng)計顯著性檢驗法,檢驗區(qū)分度值是否顯著。(3)分組標準影響鑒別指數(shù)值(D)。極端組劃分標準的不同,求得的區(qū)分長值也不同。分組越極端,其D值越大。通常取27作為極端分組劃分的標準。(4)被試樣本的同質(zhì)性程度影響區(qū)分度值的大小。被試團體越具有同質(zhì)性,即個體之間水平越接近,其測題的區(qū)分度就越小。反之,若是
38、施測于具有較大異質(zhì)性的被試團體,即使是對另外一同質(zhì)團體來說區(qū)分度很小的項目,也可能具有很高的區(qū)分度。所以,項目的區(qū)分度大小是針對特定團體而言的。6. 論述猜測校正的優(yōu)缺點?P88優(yōu)點:可避免降低測驗的信度。校正后的得分可以范瑛被試的真正水平和能力。在教育測驗中,可以培養(yǎng)被試誠實的美德。比較公平。缺點:公式的基本假設(shè)不成立。只要被試能答完全部試題,則猜測校正無實質(zhì)作用。不采用猜測校正對信度并無重大影響。有時會出現(xiàn)無法解釋的現(xiàn)象。實際生活中,京城缺乏充分的證據(jù)和資料,必須憑借部分知識來判斷,且進行合理猜測是值得培養(yǎng)的習(xí)慣??傊?,對于是否需要采用猜測校正,并無定論。但是在答題時間充裕,備選答案數(shù)目(
39、k)在四個或以上的選擇題,則沒有必要進行校正記分。7. 對多重選擇題作項目分析可解決什么問題?P89(1)項目是否具有所預(yù)期的功能?對于常模參照測驗,測題是否有足夠的區(qū)分度?對目標參照測驗來說,測題是否能充分地測量到教學(xué)的結(jié)果?(2)項目的難度是否得當?(3)項目是否有缺陷?(4)誘答選項是否都有效?8. 對多重選擇題作項目分析的具體步驟是什么?P90(1)按被試測驗的總分,從高到低依次排列試卷。(2)從最高分依次向下取全部試卷的27作為高分組。(3)從低分組依次向上取全部試卷的27作為低分組。(4)分別登記高分組與低分組選中各選擇項的人數(shù)(亦可將人數(shù)換為人數(shù)比例),然后登記。(5)根據(jù)登記結(jié)
40、果進行選擇項的質(zhì)量分析。第七章 測驗常模一、名詞解釋1. 原始分數(shù):被試在接受測驗后,根據(jù)測驗的記分標準,對照被試的反應(yīng)所計算出的測驗分數(shù)。2. 導(dǎo)出分數(shù):是在原始分數(shù)轉(zhuǎn)換的基礎(chǔ)上,按照一定的規(guī)則,經(jīng)過統(tǒng)計處理后獲得的具有一定參考點和單位,且可以相互比較的分數(shù)。常用的導(dǎo)出分數(shù)有百分等級、標準分數(shù)、T分數(shù)等。3. 標準分數(shù)或Z分數(shù):是一種具有相等單位的量數(shù),又稱作Z分數(shù),以Z表示。它是將原始分數(shù)與團體的平均數(shù)之差除以標準差所得的商數(shù),是以標準差為單位度量原始分數(shù)離開其平均數(shù)的分數(shù)之上多少個標準差,或是在平均數(shù)之下多少個標準差。4. 正態(tài)化的標準分數(shù):為了是來源于不同分布的分數(shù)進行比較,可使用非線
41、性變換,將非正態(tài)分布的分數(shù)強制性地扭轉(zhuǎn)成正態(tài)分布,具體做法為:將每個原始分數(shù)轉(zhuǎn)換為百分等級,然后使用正態(tài)分布表,將對應(yīng)的百分等級直接看成是正態(tài)分布曲線下的面積值,找出所對應(yīng)的Z值(偏差值),這種方式所得到的分數(shù)即正態(tài)化的標準分數(shù)。5. 常模:是根據(jù)標準化樣本的測驗分數(shù)經(jīng)過統(tǒng)計處理而建立起來的具有參照點和單位的測驗量表。6. 常模團體:是由具有某種共同特征的人所組成的一個群體,或是該團體的一個樣本。7. 發(fā)展量表:人的許多心理特質(zhì),如智力、技能等,是隨時間而發(fā)展的,所以可以將個人的成績與各種發(fā)展水平的人的平均成績相比較,制定出發(fā)展量表。在這種量表中,明確指出個人的按正常途徑發(fā)展的心理特征處在什么
42、樣的發(fā)展水平。8. 年級當量:將被試的測驗成績與某一年級的學(xué)生的平均分數(shù)作比較,而說成相當于某一年級水平。9. 剖析圖:把一套測驗中幾個分測驗分數(shù)同圖表(圖形)表現(xiàn)出來。從剖析圖上可以很直觀地看出被試在各個分測驗中的表現(xiàn)及其相對應(yīng)的位置。10. T分數(shù):由于Z分數(shù)常常帶有小數(shù)和出現(xiàn)負值 ,使用起來常覺不便,也容易出錯,并且與日常生活中的評分形式不一致,不直觀。因此產(chǎn)生了多種將Z分數(shù)作線性變換,使負號與小數(shù)消失,全部變?yōu)檎龜?shù)的轉(zhuǎn)換方法。T分數(shù)就是由標準分數(shù)直接轉(zhuǎn)換而來的,計算公式為T=10Z+50,式中,T為T分數(shù),Z為標準分數(shù)。二、簡答與論述1. 為什么將原始分數(shù)轉(zhuǎn)化為導(dǎo)出分數(shù)?P93被試在接
43、受測驗后,根據(jù)測驗的記分標準,對照被試的反應(yīng)所計算出的測驗分數(shù)稱作原始分數(shù)。原始分數(shù)反映了被試答對題目的個數(shù)或作答正確的程度。但是原始分數(shù)不能直接反映出被試之間的差異狀況,不能刻畫出被試相互比較后所處的地位,也不能說明被試在其他等值測驗上應(yīng)獲得什么樣的分值。為了使原始分數(shù)本身具有意義,使不同測驗的分數(shù)可以相互比較,就必須將原始分數(shù)轉(zhuǎn)換為導(dǎo)出分數(shù)。2. 百分等級分數(shù)的優(yōu)缺點?P95-96(1)優(yōu)點:百分等級是一種相對位置量數(shù),具有可比性,且具有易于計算、解釋方便等優(yōu)點,對一般教師、學(xué)生和家長來說,均能了解百分等級的意義,所以它較適用于不同的對象和性質(zhì)不同的測驗。另外,百分等級不受原始分數(shù)分布狀態(tài)
44、的影響,即使分數(shù)分配不是正態(tài)的,也不會改變百分等級常模的解釋能力。但百分等級是一種順序量數(shù),它在統(tǒng)計分析中不具有可加性。(2)缺點:單位不等,尤其在分配的兩個極端。百分等級只具有順序性,而無法用它來說明不同被試之間分數(shù)差異的數(shù)量。 另外,在運用百分等級時應(yīng)注意到,百分等級是相對于特定的被試團體而言的,所以,解釋時不能離開特定的參照團體。3. 標準分數(shù)或Z分數(shù)的特點?P97Z分數(shù)是以一批分數(shù)的平均數(shù)為參照點,以標準差為單位的等距量表。Z分數(shù)不僅具有可比性,而且還具有可加性,它由符號與絕對值兩部分構(gòu)成。正負符號表示原始分數(shù)在平均數(shù)之上或之下,絕對值表示原始分數(shù)與平均數(shù)的距離。除此之外,Z分數(shù)還具有
45、一下兩個重要性質(zhì):(1)Z分數(shù)與原始分數(shù)X的分布形態(tài)相同。(2)任何一組原始分數(shù)經(jīng)轉(zhuǎn)換為Z分數(shù)以后均有?Z=0,SZ=1,所以可以利用Z分數(shù)對不同測驗分數(shù)進行比較。如果原始分數(shù)屬正態(tài)分布或近似正態(tài),則Z分數(shù)的范圍大致在-3.00到+3.00之間(約占全體的99.73)。4. 標準分數(shù)變式的優(yōu)缺點(或標準分數(shù)變式的評價)P99(1)優(yōu)點:具有等單位特點,便于進一步進行統(tǒng)計分析工作。正態(tài)分布下,可以利用正態(tài)分布表將各種導(dǎo)出分數(shù)與百分等級分數(shù)作換算。正態(tài)分布下,運用變式分數(shù)可以將幾個測驗上的分數(shù)作直接的比較。即使是非正態(tài)分布,也可運用由正態(tài)化的Z分數(shù)轉(zhuǎn)換而得的變式分數(shù)進行直接比較分析。(2)缺點:分
46、數(shù)過于抽象,不易理解,正如在介紹麥柯爾的T分數(shù)時所提到的那樣不為一般人所熟悉。在非正態(tài)分布下,分布形態(tài)不同的的變式分數(shù),仍然不可以作相互比較,也不能相加求和。5. 分數(shù)合成中存在什么問題?P102每當將測驗分數(shù)組合時,必須考慮以下3個問題:(1)采用什么方法來合成分數(shù)?(2)什么形式是最適當?shù)姆謹?shù)組合?(3)需要多少及何種測驗分數(shù)作最適當?shù)慕M合分數(shù)?6. 簡述分數(shù)合成的方法及其優(yōu)缺點?P103-105(1)臨床診斷直覺合成。優(yōu)點:具有高度的綜合性。具有靈活的針對性,能就特定的個人作具體的結(jié)論。缺點:主觀加權(quán)易受決策者的偏見影響,不夠客觀。缺乏精確的數(shù)量分析,沒有精確的數(shù)量指標。(2)加權(quán)求和合
47、成。(3)多重回歸。(4)多重劃分。7. 確定常模團體的注意事項(或如何選擇好的常模團體)P106-107群體構(gòu)成的界限必須明確。常模團體必須是所測群體的一個代表性樣本。 取樣的過程必須明確且有詳盡的描述。樣本大小要適當。 常模團體必須是近時的。注意一般常模與特殊常模的結(jié)合。8. 制定常模的過程?P108(1)確定測驗將用于哪一個群體。根據(jù)測驗群體,選定最基本的統(tǒng)計量,決定抽樣誤差的允許界限,在此基礎(chǔ)上設(shè)計具體的抽樣方法,并對該群體進行抽樣,得到常模團體。(2)對常模團體進行施測,并獲得團體成員的邪惡眼分數(shù)及分數(shù)分布。(3)確定常模分數(shù)類型,制作常模分數(shù)轉(zhuǎn)換表,即常模量表,同時給出抽取常模團體
48、的書面說明,以及常模分數(shù)的解釋指南等。9. 呈現(xiàn)常模資料的方法及其注意事項?P111-115呈現(xiàn)常模的方法主要有兩種:轉(zhuǎn)化表與剖析圖。(1)轉(zhuǎn)化表又稱常模表,常模表有簡單轉(zhuǎn)化表與復(fù)雜轉(zhuǎn)化表兩種。利用轉(zhuǎn)化表解釋分數(shù)時應(yīng)注意:只能將分數(shù)與表中所描述的常模團體作比較,要和其他常模團體比較,則需其他的常模表。在沒有效度資料時,轉(zhuǎn)化表只能將原始分數(shù)轉(zhuǎn)換為另一種分數(shù),而不能作任何推論,即使有效度資料,效標行為也只能從常模資料推論來的。(2)使用剖析圖作解釋,要求各個分測驗所使用的必須是同一個常模團體,否則無法進行比較。第八章 心理與教育測驗的編制與實施簡答與論述1. 編制標準化心理與教育測驗的步驟?P11
49、7確定測驗?zāi)康?。制定編題計劃。編輯測驗項目。預(yù)測與項目分析。 合成測驗。測驗標準化。鑒定測驗。編寫測驗說明書。2. 預(yù)測應(yīng)注意的問題(或如何做好預(yù)測)P120(1)預(yù)測對象應(yīng)取自將來正式測驗時準備施用的群體,雖然人數(shù)不必太多,但要具有代表性。(2)預(yù)測的情境應(yīng)力求同正式測驗的情境一致。(3)預(yù)測的時限可以適當延長,以便每一受測者都能將題目做完。(4)施測者應(yīng)對受測者的反應(yīng)加以記錄。如在同一時限內(nèi),受測者所完成的題數(shù),以及受測者反映的題意不清之處等,以便修改項目時等參考。3. 選擇測驗項目的指標是什么?P121測驗的性質(zhì),即要選擇那些能夠測量所要測量的東西的項目。假若要測量的是語言推理能力,就不
50、能選擇測量閱讀能力或運算能力的項目。項目的難度。選擇多大難度的項目并無固定的標準,選拔性測驗要求難度大些,考察性測驗則要求難度不可太高,人格測驗則不要求難度。 項目的區(qū)分度。一般來說,項目的區(qū)分度越高越好,對于選拔性測驗尤為如此,但有時也可以保留若干區(qū)分度不高的項目,這要視項目的重要性而定。4. 測驗說明書包括哪些內(nèi)容?P124本測驗的目的與功能。本測驗的理論依據(jù)。 測驗內(nèi)容的及實施測驗的方法,包括:何種測驗、內(nèi)容分幾部分、每部分有多少測驗項目、如何作答等等。測驗的標準答案和評分方法。 關(guān)于測驗的信度、效度資料的說明。常模表,即如何依據(jù)常模解釋測驗結(jié)果。5. 論述解釋測驗分數(shù)時遵循的原則(或如
51、何正確解釋測驗分數(shù)的意義)P129-131主試應(yīng)充分了解測驗的性質(zhì)與功能。對導(dǎo)致測驗結(jié)果的原因的解釋應(yīng)慎重,謹防片面極端。 必須充分估計測驗的常模和效度的局限性。解釋分數(shù)應(yīng)參考其他有關(guān)資料。 對測驗分數(shù)應(yīng)以“一段分數(shù)”來解釋,而不應(yīng)以“特定的數(shù)值”來解釋。對來自不同測驗的分數(shù)不能直接加以比較。6. 論述向當事人報告測驗分數(shù)的基本原則?P131-132使用當事人多理解的語言。要保證當事人知道這個測驗測量或預(yù)測什么,這里并不需要作詳細的技術(shù)性解釋。 如果分數(shù)是以常模為參考的,就要使當事人知道他(她)是和什么團體在進行比較。要使當事人認識到分數(shù)只是一個估計。 要使當事人知道如何運用他的分數(shù)。要考慮測
52、驗分數(shù)將給受測者帶來什么影響。測驗結(jié)果應(yīng)向無關(guān)的人員保密。對低分者的解釋應(yīng)謹慎小心。報告測驗分數(shù)時應(yīng)設(shè)法了解當事人的心理感受,并采取適當?shù)拇胧┘右砸龑?dǎo)。第九章 測驗等值1. 測驗等值的實質(zhì)?(1)從本質(zhì)上來說,測驗等值就是通過對考核同一種心理品質(zhì)的多個測驗形式作出測驗分數(shù)系統(tǒng)的轉(zhuǎn)換,進而使得這些不同測驗形式的測驗分數(shù)之間具有可比性。在實際操作中,測驗等值可使各個不同形式的測驗分數(shù)均對應(yīng)起來,測驗主持者可以任意指定其中的一個分數(shù)形式作為基準,而使所有其他形式的分數(shù)都轉(zhuǎn)化到這個基準形式上。(2)測驗等值中所說的測量分數(shù)系統(tǒng)的轉(zhuǎn)換與測驗原始分數(shù)及導(dǎo)出分數(shù)之間的轉(zhuǎn)換是不相同的。等值轉(zhuǎn)換的目的是為了比較
53、兩個不同測驗形式之間的實測分數(shù),導(dǎo)出分數(shù)轉(zhuǎn)換是為了將一個實測分數(shù)轉(zhuǎn)換到一個可評價個體相對位置的分數(shù)系統(tǒng)上去。等值轉(zhuǎn)換是兩個或多個不同測驗形式分數(shù)系統(tǒng)的轉(zhuǎn)換,兩者之間是有本質(zhì)差異的。2. 論述測驗等值的條件?P136(1)同質(zhì)性。被等值的不同測驗形式所測的必須是同一種心理品質(zhì),測驗的內(nèi)容與范圍也應(yīng)該基本相同。不是測同一種心理品質(zhì)的測驗是不能被等值的。(2)等信度。被等值的不同測驗形式必須有相等的測驗信度。不能指望一個低信度的測驗通過與一個高信度測驗等值而提高自身的可靠性。(3)公平性。公平性是指考生參加被等值的不同測驗形式中的任一個測試,等值后的結(jié)果都是一樣的,不能出現(xiàn)參加不同形式的測試等值后的
54、結(jié)果有高有低的現(xiàn)象。(4)可遞推性。如果測驗x與測驗y之間有等值轉(zhuǎn)換關(guān)系f(x)=y,測驗y與測驗z之間有等值轉(zhuǎn)換關(guān)系g(y)=z,那么一定有測驗x與測驗z之間的關(guān)系h存在,h(x)=gf(x)=z。這種遞推關(guān)系還可以推至更多的已等值的測驗形式。如果這種遞推關(guān)系不存在,或者不同途徑遞推的結(jié)果不相同,那么這些測驗形式中必有不等值的形式存在。(5)對稱性。對兩個待等值的測驗形式x與y,無論等值轉(zhuǎn)換從哪個測驗出發(fā),所獲得的等值對應(yīng)關(guān)系是相同的,即如果從形式x出發(fā),獲得等值關(guān)系f(x)=y;從形式y(tǒng)出發(fā),獲得等值關(guān)系g(y)=x,則一定有f=g-1,也就是說,f 與g一定是互逆的關(guān)系。(6)樣本不變性
55、。測驗與測驗的等值關(guān)系是由與本身的內(nèi)在性質(zhì)決定的,與為尋找這種等值關(guān)系而采集數(shù)據(jù)時所使用的樣本沒有關(guān)系,也與采集數(shù)據(jù)時測驗的情境沒有關(guān)系。如果測驗等值關(guān)系會受到測驗樣本的影響而變化,則所尋獲的測驗等值關(guān)系是虛假的。第十章 目標參照測驗一、名詞解釋1. 目標參照測驗:是根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測驗,并且,被試在測驗中所得結(jié)果,也是根據(jù)某一明確界定的行為標準直接進行解釋的。二簡答與論述1. 為什么相關(guān)系數(shù)表示的信度指標在目標參照測驗上不太適用?P161由于以相關(guān)表示的測驗信度的高低在很大程度上受到受測者團體異質(zhì)性的影響,即被試異質(zhì)性越高,測驗分數(shù)分布就越廣,從而相關(guān)系數(shù)越高,測驗信度
56、相應(yīng)也就越高,因而,這些信度指標在目標參照測驗上的應(yīng)用價值就不免受到懷疑:目標參照測驗的目的一般不在于鑒別個體差異,而在于了解個體在所測內(nèi)容上的掌握水平,因而在大多數(shù)情況下,被試團體在目標參照測驗上的分數(shù)分布比較集中,如高中畢業(yè)會考,一般來說絕大多數(shù)考生都能達到所要求的水平。這樣一來,若用相關(guān)系數(shù)作信度指標,由于其受到分數(shù)分布的影響,那么即使測驗本身具有較高的穩(wěn)定性和一致性,所得的信度系數(shù)也會很低。2. 比較目標參照測驗與常模參照測驗的異同?第十一章 學(xué)績測驗一、名詞解釋1. 學(xué)績:通常是指個體經(jīng)過對某種知識或技術(shù)的學(xué)習(xí)或訓(xùn)練之后所取得的“成績”,一般表現(xiàn)為個體心理品質(zhì)在知識、技能或某種能力方
57、面的增加和提高,是個體認識性心理品質(zhì)的發(fā)展。2. 學(xué)績測驗:是對個體在一個階段的學(xué)習(xí)或訓(xùn)練之后知識、技能的發(fā)展水平的測定。3. 標準化學(xué)績測驗:是指在心理與教育測量學(xué)原理指導(dǎo)下,遵循一定的程序所編制的各方面質(zhì)量都達到規(guī)定標準的學(xué)績測驗。4. 斯坦福成就測驗:屬于綜合性學(xué)績考察測驗,也是一種供團體使用的常模參照測驗。它有兩個配套測驗,一個是斯坦福早期學(xué)校成就測驗,一個是斯坦福學(xué)業(yè)技能測驗。二、簡答與論述1. 簡述學(xué)績測驗的作用?P171學(xué)生經(jīng)過一個階段的學(xué)習(xí),到底獲得了多少知識,提高了多大的能力,可以通過學(xué)績測驗進行測定。學(xué)績測驗的結(jié)果反饋給學(xué)生,學(xué)生可以總結(jié)學(xué)習(xí)經(jīng)驗,糾正不足,利于學(xué)生進一步學(xué)
58、習(xí)。學(xué)績測驗結(jié)果反饋給教師,教師可以總結(jié)教學(xué)經(jīng)驗,利于教師進一步改進教學(xué)。學(xué)校還使用學(xué)績測驗甄別學(xué)習(xí)困難兒童,診斷學(xué)生學(xué)習(xí)困難的原因,以便即時制定和采取補救措施,幫助學(xué)生全面掌握所學(xué)知識,全面提高專業(yè)能力。學(xué)校還應(yīng)用學(xué)績測驗輔助教學(xué)管理。升學(xué)、畢業(yè)、升級、留級、劃分班級組別都需要學(xué)績測驗的信息。 現(xiàn)代社會的人事管理也應(yīng)用學(xué)績測驗。人員錄用、晉職提級都可以利用學(xué)績測驗,以測驗成績作為重要的取舍依據(jù)。2. 標準化學(xué)績測驗的基本要求?P174命題組卷標準化。標準化試卷的所有試題都是經(jīng)過精心編制的,試題測量目標明確,語詞意義清晰,試題難度、區(qū)分度、達到規(guī)定標準。施測標準化。標準化測驗必須在統(tǒng)一標準的環(huán)
59、境下施測。統(tǒng)一標準環(huán)境包括測驗場所的標準統(tǒng)一、測驗時間統(tǒng)一、測驗的指導(dǎo)語統(tǒng)一、提供給考生的測驗材料統(tǒng)一、材料出示的順序統(tǒng)一。評分標準化。標準化測驗的評分在測驗編制的同時就要制定好標準答案和評分規(guī)則。標準答案要正確、規(guī)范,最好是唯一的。評分規(guī)則應(yīng)盡量細致、客觀,最好是沒有伸縮性的。測驗分數(shù)解釋標準化。對于常模參照性測驗,其意是編制測驗時必須搜集常模樣本,編制好測驗常模。3. 標準化學(xué)績測驗的編制步驟P175-177確定測驗?zāi)康模x定測驗編制的方法。分析測量目標,擬定測驗編制計劃。編題征題與選題組卷。調(diào)查測驗質(zhì)量參數(shù),編制測驗常模。 編寫測驗指導(dǎo)書,正式出版發(fā)行。4. 題庫的基本要求有哪些?你認為
60、建設(shè)題庫有什么好處?P179(1)基本要求:植根于一種科學(xué)的測量理論;儲備有一定數(shù)量的試題,所有試題品質(zhì)優(yōu)良,技術(shù)參數(shù)完備;題庫內(nèi)部結(jié)構(gòu)層次清楚、分類嚴謹、試題檢索方便;題庫管理方便、可控性強、易于維護更新;保密性強。(2)好處:一些大規(guī)模的標準化學(xué)績測驗應(yīng)用范圍廣,施測周期短,對試卷的需要比較頻繁。每次都臨時編題組卷,耗費大而效率又不高。解決這個問題的一個有效辦法就是建設(shè)一個題庫。應(yīng)用題庫組拼標準化學(xué)績測驗的試卷,具有經(jīng)濟、高效而且保密性強的特點。5. 教師自編課堂測驗的特點?P182-183測驗形式靈活多變,與測驗?zāi)康耐耆恢隆y驗內(nèi)容與教材內(nèi)容高度一致。測驗難度切合學(xué)生的實際水平。測驗編
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綜合能源服務(wù)員7S考核試卷含答案
- 2026年隱患排查報告制度(三篇)
- 高爐運轉(zhuǎn)工安全宣貫評優(yōu)考核試卷含答案
- 觀賞魚養(yǎng)殖工操作水平知識考核試卷含答案
- 激光加工設(shè)備裝調(diào)工崗前基礎(chǔ)理論考核試卷含答案
- 有機硅生產(chǎn)工安全培訓(xùn)模擬考核試卷含答案
- 數(shù)控磨工崗前核心技能考核試卷含答案
- 中藥膠劑工風(fēng)險識別考核試卷含答案
- 汽車模型工崗前安全意識考核試卷含答案
- 2026秋招:貴州公路建設(shè)養(yǎng)護集團筆試題及答案
- 期末檢測卷(試題)-2025-2026學(xué)年一年級上冊數(shù)學(xué) 蘇教版
- 2026年樂陵市市屬國有企業(yè)公開招聘工作人員6名備考題庫參考答案詳解
- 基礎(chǔ)知識(期末復(fù)習(xí))-2024人教版八年級語文上冊(解析版)
- 江蘇省G4(南師大附中、天一、海安、海門)聯(lián)考2026屆高三年級12月份測試數(shù)學(xué)試卷(含答案詳解)
- 2025河北唐山市遷安市招調(diào)公務(wù)員8人備考題庫附答案
- 2025智能機器人行業(yè)產(chǎn)業(yè)鏈上下游協(xié)同發(fā)展建議
- 服飾搭配技巧培訓(xùn)課件
- 公文寫作實務(wù)及范文指導(dǎo)
- 2025云南非物質(zhì)文化遺產(chǎn)保護現(xiàn)狀與傳承規(guī)劃研究
- 工會招聘筆試題型及答案2025年
- 老年人安寧療護護理計劃制定與實施指南
評論
0/150
提交評論