版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章第二章 教育測(cè)量與評(píng)價(jià)教育測(cè)量與評(píng)價(jià)的質(zhì)量特性的質(zhì)量特性第一節(jié)第一節(jié) 教育測(cè)量與評(píng)價(jià)的信度教育測(cè)量與評(píng)價(jià)的信度第二節(jié)第二節(jié) 教育測(cè)量與評(píng)價(jià)的效度教育測(cè)量與評(píng)價(jià)的效度第三節(jié)第三節(jié) 教育測(cè)量與評(píng)價(jià)中項(xiàng)目的難度教育測(cè)量與評(píng)價(jià)中項(xiàng)目的難度第三節(jié)第三節(jié) 教育測(cè)量與評(píng)價(jià)中項(xiàng)目的區(qū)分度教育測(cè)量與評(píng)價(jià)中項(xiàng)目的區(qū)分度第二章第二章 教育測(cè)量的質(zhì)量特性教育測(cè)量的質(zhì)量特性 衡量教育測(cè)量的質(zhì)量,可采用四個(gè)指標(biāo): 信 度 主要對(duì)整個(gè)測(cè)驗(yàn)而言。 效 度 難 度 主要對(duì)測(cè)驗(yàn)項(xiàng)目而言。 區(qū)分度 一、什么是信度一、什么是信度 指測(cè)量結(jié)果的穩(wěn)定性或可靠性程度。 一般地說(shuō),一個(gè)好的測(cè)量必須具有較高的信度,也就是說(shuō),一個(gè)好的測(cè)量
2、工具,只要遵守操作規(guī)則,其結(jié)果就不應(yīng)隨工具的使用者或使用時(shí)間等方面的變化而發(fā)生較大的變化。第一節(jié)第一節(jié) 教育測(cè)量與評(píng)價(jià)的信度教育測(cè)量與評(píng)價(jià)的信度對(duì)信度的理解 信度指實(shí)測(cè)值(X)和真值(T)相差的程度; 考察信度系數(shù)時(shí),常常采用相關(guān)系數(shù)作為信度指標(biāo),測(cè)驗(yàn)結(jié)果之間的相關(guān)程度越高,信度就越高。采用不同的方式計(jì)算相關(guān)系數(shù),就得到不同類(lèi)型的信度系數(shù)。 心理測(cè)驗(yàn)的信度值在0-1.00之間,當(dāng)信度系數(shù)等于1.00時(shí),表示測(cè)驗(yàn)完全可靠;當(dāng)信度系數(shù)等于0時(shí),則表示測(cè)驗(yàn)根本不可靠。問(wèn)題 一個(gè)能力測(cè)驗(yàn)用于人才招聘,經(jīng)檢驗(yàn)它的信度為0.70,如何理解這個(gè)信度系數(shù)的含義。 理解:0.70的信度系數(shù)表明,在不同的招聘候選
3、人之間進(jìn)行比較,候選人測(cè)驗(yàn)分?jǐn)?shù)的70%差別是由于個(gè)體之間真實(shí)的能力差異所導(dǎo)致的,而30%差別是由于隨機(jī)誤差所導(dǎo)致。二、信度的種類(lèi)及估計(jì)方法 采用不同的方法來(lái)計(jì)算相關(guān)系數(shù),就會(huì)得到不同類(lèi)型的信度指標(biāo):重測(cè)信度、復(fù)本信度、分半信度、同質(zhì)性信度、評(píng)分者信度。 五種信度的含義和計(jì)算方法各異,我們?cè)谑褂脮r(shí)要特別注意每一種信度的特定內(nèi)涵和適用范圍。(一)重測(cè)信度(一)重測(cè)信度 指同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。 其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用皮爾遜積差相關(guān)的公式來(lái)計(jì)算。施測(cè)施測(cè)再施測(cè)再施測(cè)相關(guān)系數(shù)相關(guān)系數(shù)時(shí)間間隔時(shí)間間隔重測(cè)信度的計(jì)算重測(cè)信度的計(jì)算 222
4、2YYNXXNYXXYNr 2222YYNXXNYXXYNrX X:第一次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù);:第一次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù);Y Y:第二次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù);:第二次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù); N N:被試人數(shù)。:被試人數(shù)。u統(tǒng)計(jì)學(xué)上,我們通常把對(duì)同一組被試實(shí)施的兩次統(tǒng)計(jì)學(xué)上,我們通常把對(duì)同一組被試實(shí)施的兩次等值測(cè)驗(yàn)的成績(jī)的相關(guān)系數(shù)作為這一測(cè)驗(yàn)的信度。等值測(cè)驗(yàn)的成績(jī)的相關(guān)系數(shù)作為這一測(cè)驗(yàn)的信度。例一 用一個(gè)算術(shù)四則的速度測(cè)驗(yàn)12個(gè)小學(xué)生,得分記為X,為了考察測(cè)量結(jié)果的可靠性,于3個(gè)月后再測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠? 學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10 11 12 X 20 20 21 22
5、 23 23 23 24 25 26 26 27 Y 20 21 21 20 23 23 25 25 26 26 27 29在使用重測(cè)法計(jì)算信度值時(shí),應(yīng)注意以下問(wèn)題: 1、信度的取值范圍為0,1,當(dāng)信度值較大時(shí),說(shuō)明前后兩次測(cè)量結(jié)果比較一致; 2、兩次測(cè)驗(yàn)之間的時(shí)間間隔要適宜。應(yīng)由測(cè)驗(yàn)的性質(zhì)、測(cè)題類(lèi)型、測(cè)題數(shù)量和被試特點(diǎn)所決定; 3、重測(cè)法適用于速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn); 4、應(yīng)注意提高被試者的積極性。重測(cè)信度與時(shí)間間隔 兩次測(cè)量之間的間隔時(shí)間不同,重測(cè)信度也不同。 間隔時(shí)間太短,存在記憶效應(yīng);間隔時(shí)間太長(zhǎng),影響測(cè)量的干擾因素增加。一般而言,時(shí)間間隔越長(zhǎng),信度系數(shù)越低。 適宜的間隔時(shí)間因測(cè)驗(yàn)
6、性質(zhì)、被試特點(diǎn)而異。 如:對(duì)兒童測(cè)量時(shí)間間隔相對(duì)短一些成人測(cè)量時(shí)間間隔可以長(zhǎng)一些。一般以2周到4周較宜,最好不超過(guò)6個(gè)月。 報(bào)告重測(cè)信度時(shí)要明確說(shuō)明兩次測(cè)驗(yàn)之間的時(shí)間間隔,并且,一個(gè)經(jīng)過(guò)良好評(píng)估的測(cè)驗(yàn)應(yīng)當(dāng)具有多個(gè)時(shí)間間隔的重測(cè)信度。(二)復(fù)本信度(二)復(fù)本信度 指兩個(gè)平等的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。 其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。 所謂復(fù)本測(cè)驗(yàn)是指在性質(zhì)、內(nèi)容、題型、題數(shù)、難度等方面都一致(或相等)的兩份或多份測(cè)驗(yàn)。施測(cè)施測(cè)A型型施測(cè)施測(cè)B型型相關(guān)系數(shù)相關(guān)系數(shù)連續(xù)施測(cè)或間隔施測(cè)連續(xù)施測(cè)或間隔施測(cè)例二 以A、B兩型英語(yǔ)復(fù)本測(cè)驗(yàn)對(duì)初中三年級(jí)10個(gè)學(xué)生施測(cè),為
7、避免由測(cè)驗(yàn)施測(cè)順序所造成的誤差,其中5個(gè)學(xué)生先做A型測(cè)驗(yàn),休息15分鐘后,再做B型測(cè)驗(yàn);而另5個(gè)學(xué)生先做B型測(cè)驗(yàn),休息15分鐘后,再做A型測(cè)驗(yàn)。10個(gè)學(xué)生A型測(cè)驗(yàn)結(jié)果記為X,B型測(cè)驗(yàn)結(jié)果記為Y,其測(cè)驗(yàn)的復(fù)本信度如何? 學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10 X 19 19 18 17 16 15 15 14 13 12 Y 20 17 18 18 17 15 13 15 12 12復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn):復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn):優(yōu)點(diǎn):優(yōu)點(diǎn): 1、測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同的時(shí)間使用,、測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同的時(shí)間使用,其信度既可以反映在不同時(shí)間的穩(wěn)定性,又可其信度既可以反映在不同時(shí)
8、間的穩(wěn)定性,又可以反映對(duì)于不同測(cè)題的一致性;以反映對(duì)于不同測(cè)題的一致性; 2、兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測(cè)信、兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測(cè)信息的一些缺點(diǎn),如首測(cè)時(shí)再測(cè)在記憶、練習(xí)、息的一些缺點(diǎn),如首測(cè)時(shí)再測(cè)在記憶、練習(xí)、效果的影響,間隔期間獲得新知識(shí)的影響,兩效果的影響,間隔期間獲得新知識(shí)的影響,兩次施測(cè)的環(huán)境不同和被試主觀狀態(tài)不同的影響,次施測(cè)的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測(cè)驗(yàn)所作訓(xùn)練的影響等。以及為了應(yīng)付測(cè)驗(yàn)所作訓(xùn)練的影響等。復(fù)本信度缺點(diǎn):復(fù)本信度缺點(diǎn): 1、編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的,如、編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的,如果兩個(gè)復(fù)本過(guò)分相似,則變成再
9、測(cè)形式,而過(guò)果兩個(gè)復(fù)本過(guò)分相似,則變成再測(cè)形式,而過(guò)分不相似,又使等值的條件不存在;分不相似,又使等值的條件不存在; 2、兩個(gè)復(fù)本測(cè)驗(yàn)有可能在某種程度上測(cè)量了、兩個(gè)復(fù)本測(cè)驗(yàn)有可能在某種程度上測(cè)量了不同的性質(zhì),這就會(huì)低估測(cè)驗(yàn)的信度;不同的性質(zhì),這就會(huì)低估測(cè)驗(yàn)的信度; 3、被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn),可能、被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn),可能減少完成測(cè)驗(yàn)的積極性;減少完成測(cè)驗(yàn)的積極性; 4、雖然兩個(gè)復(fù)本測(cè)驗(yàn)的題目材料不同,但被、雖然兩個(gè)復(fù)本測(cè)驗(yàn)的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類(lèi)旁通,試一旦掌握了解題的某一模式,就能觸類(lèi)旁通,有可能失去復(fù)本的意義。有可能失去復(fù)本的意義。(三
10、)同質(zhì)性信度(三)同質(zhì)性信度z同質(zhì)性信度同質(zhì)性信度 也稱(chēng)內(nèi)部一致性信度,指測(cè)驗(yàn)內(nèi)部所有題目也稱(chēng)內(nèi)部一致性信度,指測(cè)驗(yàn)內(nèi)部所有題目之間的一致性程度。之間的一致性程度。 兩層意思:兩層意思: 測(cè)驗(yàn)所有題目測(cè)的是否為同一種心理特質(zhì);測(cè)驗(yàn)所有題目測(cè)的是否為同一種心理特質(zhì); 測(cè)驗(yàn)所有題目得分之間是否具有較高的正相關(guān)。測(cè)驗(yàn)所有題目得分之間是否具有較高的正相關(guān)。 基本假設(shè):基本假設(shè):當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同質(zhì)性信度時(shí),當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同質(zhì)性信度時(shí),說(shuō)明測(cè)驗(yàn)主要測(cè)的是某一個(gè)單一心理特質(zhì),由于眾說(shuō)明測(cè)驗(yàn)主要測(cè)的是某一個(gè)單一心理特質(zhì),由于眾多題目測(cè)試了同一心理特質(zhì),那么實(shí)測(cè)結(jié)果就是該多題目測(cè)試了同一心理特質(zhì),那
11、么實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映。特質(zhì)水平的反映。估計(jì)方法 分半信度(分半信度(p49) 庫(kù)德庫(kù)德-理查遜信度(理查遜信度(p50) 克龍巴赫系數(shù)(克龍巴赫系數(shù)(系數(shù),系數(shù),p52) 荷伊特信度(荷伊特信度(p52)|分半信度分半信度 將測(cè)驗(yàn)分半,再求被試在每一半測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。 首先根據(jù)內(nèi)容、形式、題數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、難度、測(cè)題間相關(guān)以及分布形態(tài)相等的原則,將試題分成兩半,或者將從易到難排列的測(cè)題,按照測(cè)題序號(hào),奇數(shù)測(cè)題為一組,偶數(shù)測(cè)題為一組,分成兩半; 然后計(jì)算每個(gè)被試在兩個(gè)分半測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),再用斯皮爾曼布朗公式加以校正:p49 分半信度只需要一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn),它
12、比重測(cè)信度和復(fù)本信度的操作更簡(jiǎn)便。 注意:注意:當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),不宜使用分半信度。分半信度的計(jì)算方法1、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差相等方差相等時(shí),計(jì)算時(shí),計(jì)算兩個(gè)兩個(gè)“半測(cè)驗(yàn)半測(cè)驗(yàn)”之間的皮爾遜積差相關(guān)系之間的皮爾遜積差相關(guān)系數(shù),然后用數(shù),然后用斯皮爾曼斯皮爾曼-布朗公式布朗公式校正。校正。rxx=2rhh/(1+rhh) 其中其中rxx是整個(gè)測(cè)驗(yàn)的分半信度,是整個(gè)測(cè)驗(yàn)的分半信度,rhh是是兩個(gè)半測(cè)驗(yàn)之間的相關(guān)系數(shù)。兩個(gè)半測(cè)驗(yàn)之間的相關(guān)系數(shù)。2、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差不相等方差不相等時(shí),時(shí), 采用采用弗朗那根公式弗朗那根公式和和盧侖公式盧侖公
13、式。u弗朗那根公式:弗朗那根公式:rxx=21-(s2a+s2b)/s2xu盧侖公式:盧侖公式:rxx=1-s2d/s2x 其中:其中: rxx:測(cè)驗(yàn)的分半信度,測(cè)驗(yàn)的分半信度, s2a、s2b:兩半測(cè)驗(yàn)上得分的方差,:兩半測(cè)驗(yàn)上得分的方差, s2x:整個(gè)測(cè)驗(yàn)上得分的方差,整個(gè)測(cè)驗(yàn)上得分的方差, s2d:兩半測(cè)驗(yàn)上得分之差的方差。:兩半測(cè)驗(yàn)上得分之差的方差。例三 對(duì)初中一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn),每答對(duì)1題得1分,答錯(cuò)1題得0分,其測(cè)驗(yàn)結(jié)果如下表,試估計(jì)該測(cè)驗(yàn)的分半信度? 學(xué)生序號(hào) 題 序 1 2 3 4 5 61 1 0 0 0 0 02 0 0 0 1 0 03 1 0 1 0 0 04
14、1 1 0 0 1 05 1 0 0 1 0 06 1 1 1 0 1 17 1 1 1 1 0 18 1 1 0 1 1 09 0 1 1 0 0 110 1 1 1 1 1 1(四)評(píng)分者信度(四)評(píng)分者信度 評(píng)分者信度評(píng)分者信度 指多個(gè)評(píng)分者給同一批被試作答情指多個(gè)評(píng)分者給同一批被試作答情況評(píng)分的一致性程度。況評(píng)分的一致性程度。 它主要用于主觀性作品的評(píng)價(jià)過(guò)程中,如它主要用于主觀性作品的評(píng)價(jià)過(guò)程中,如論述題評(píng)分,作文題評(píng)分、歌唱比賽的評(píng)論述題評(píng)分,作文題評(píng)分、歌唱比賽的評(píng)分,設(shè)計(jì)作品的評(píng)分等。分,設(shè)計(jì)作品的評(píng)分等。評(píng)分者信度的計(jì)算方法評(píng)分者信度的計(jì)算方法 1、當(dāng)評(píng)分者人數(shù)、當(dāng)評(píng)分者人數(shù)=
15、2時(shí),評(píng)分者信度等于時(shí),評(píng)分者信度等于兩者評(píng)分的相關(guān)系數(shù)。兩者評(píng)分的相關(guān)系數(shù)。 2、當(dāng)評(píng)分者人數(shù)大、當(dāng)評(píng)分者人數(shù)大2時(shí),評(píng)分者信度采時(shí),評(píng)分者信度采用肯德?tīng)柡椭C系數(shù)計(jì)算。用肯德?tīng)柡椭C系數(shù)計(jì)算。(五)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度分析(五)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度分析 1、百分比一致性指標(biāo)(、百分比一致性指標(biāo)(PA , p54 ) 2、一致性系數(shù)(一致性系數(shù)(p55) 3、 指數(shù)(指數(shù)(p55)2AadPN1()()ACCCPPPabaccdbdPNNNN222022()()()xxSKRXSX |總結(jié)和比較1:五種信度的誤差來(lái)源信度種類(lèi)信度種類(lèi)誤差來(lái)源誤差來(lái)源重測(cè)信度重測(cè)信度復(fù)本信度(同時(shí)測(cè)試)復(fù)本信度(同時(shí)測(cè)
16、試)復(fù)本信度(延時(shí)測(cè)試)復(fù)本信度(延時(shí)測(cè)試)分半信度分半信度Kuder-Richardson 和和Alpha系系數(shù)數(shù)評(píng)分者信度評(píng)分者信度 時(shí)間間隔時(shí)間間隔題目?jī)?nèi)容題目?jī)?nèi)容時(shí)間間隔與題目?jī)?nèi)容時(shí)間間隔與題目?jī)?nèi)容題目?jī)?nèi)容題目?jī)?nèi)容題目?jī)?nèi)容與心理行為特質(zhì)的同質(zhì)性題目?jī)?nèi)容與心理行為特質(zhì)的同質(zhì)性評(píng)分者間差異評(píng)分者間差異 |總結(jié)和比較總結(jié)和比較2: 測(cè)試次數(shù)、測(cè)試卷份數(shù)與信度系數(shù)測(cè)試次數(shù)、測(cè)試卷份數(shù)與信度系數(shù)測(cè)試次數(shù)測(cè)試次數(shù)測(cè)試卷份數(shù)測(cè)試卷份數(shù) 1份份 2份份 1次次 分半信度分半信度Kuder-Richardson信度信度Alpha系數(shù)系數(shù) 復(fù)本信度(同時(shí)測(cè)試)復(fù)本信度(同時(shí)測(cè)試) 2次次 重測(cè)信度重測(cè)信度
17、 復(fù)本信度(延時(shí)測(cè)試)復(fù)本信度(延時(shí)測(cè)試) 作業(yè)1、用某量表測(cè)驗(yàn)10名學(xué)生,得分記為X,為了考察結(jié)果的可靠性,于15天后用原量表對(duì)這10個(gè)學(xué)生重測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠? 學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10 X 8 10 9 6 10 7 5 7 9 4 Y 9 10 10 6 10 8 4 8 9 4 2、對(duì)10名應(yīng)試者先進(jìn)行某種測(cè)驗(yàn)X,隔適當(dāng)時(shí)間后(半年),再進(jìn)行內(nèi)容、范圍、難度類(lèi)似的第二次測(cè)驗(yàn)Y,試求測(cè)驗(yàn)的復(fù)本信度? 應(yīng)試者 1 2 3 4 5 6 7 8 9 10 X 9 10 10 6 10 8 4 8 9 4 Y 4 9 7 9 4 3 5 3 2 4
18、 3、有一個(gè)由100題構(gòu)成的量表施行于10個(gè)高三學(xué)生(分?jǐn)?shù)見(jiàn)下表)。測(cè)驗(yàn)一次后,學(xué)生即畢業(yè)離校,現(xiàn)怎樣評(píng)價(jià)測(cè)驗(yàn)結(jié)果的信度? 學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10 奇X 38 37 38 41 40 36 38 39 40 35 偶Y 37 37 36 39 39 34 38 39 39 36|信度的作用信度的作用 1 1、信度是確定測(cè)驗(yàn)工具好壞的指標(biāo)之一。、信度是確定測(cè)驗(yàn)工具好壞的指標(biāo)之一。測(cè)驗(yàn)類(lèi)型測(cè)驗(yàn)類(lèi)型 信度系數(shù)信度系數(shù) 低低中中高高學(xué)業(yè)成就測(cè)驗(yàn)學(xué)業(yè)成就測(cè)驗(yàn)0.660.920.98學(xué)術(shù)能力測(cè)驗(yàn)學(xué)術(shù)能力測(cè)驗(yàn)0.560.900.97特殊能力傾向測(cè)驗(yàn)特殊能力傾向測(cè)驗(yàn)0.260.88
19、0.96人格測(cè)驗(yàn)人格測(cè)驗(yàn)0.460.850.97興趣測(cè)驗(yàn)興趣測(cè)驗(yàn)0.420.840.93態(tài)度測(cè)驗(yàn)態(tài)度測(cè)驗(yàn)0.470.790.98注:表中數(shù)據(jù)來(lái)源,Lewis R. Aiken: Psychological testing and assessment (eighth edition), Allyn and Bacon, Inc, 1994. 判斷原則:判斷原則:u多年的研究結(jié)果,多年的研究結(jié)果,一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信的信度系數(shù)都在度系數(shù)都在0 09090以上,有的可以達(dá)以上,有的可以達(dá)0 09595;而;而人格人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)測(cè)驗(yàn)、興趣、態(tài)度、價(jià)
20、值觀等測(cè)驗(yàn)的信度一般在的信度一般在0 080800 08585或更高些?;蚋咝R0R 原有的同類(lèi)測(cè)驗(yàn)或相似測(cè)驗(yàn)。原有的同類(lèi)測(cè)驗(yàn)或相似測(cè)驗(yàn)。 2 2、信度是測(cè)量過(guò)程中隨機(jī)誤差大小的反映。、信度是測(cè)量過(guò)程中隨機(jī)誤差大小的反映。 3 3、信度可以直接解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間、信度可以直接解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間的關(guān)系,明確告知測(cè)驗(yàn)誤差的大?。ǖ年P(guān)系,明確告知測(cè)驗(yàn)誤差的大?。y(cè)量標(biāo)測(cè)量標(biāo)準(zhǔn)誤準(zhǔn)誤可作為測(cè)量誤差大小的客觀指標(biāo))可作為測(cè)量誤差大小的客觀指標(biāo)) 4 4、下結(jié)論說(shuō)某測(cè)驗(yàn)比較可靠,必須依據(jù)情境,、下結(jié)論說(shuō)某測(cè)驗(yàn)比較可靠,必須依據(jù)情境,并經(jīng)多次證實(shí)。并經(jīng)多次證實(shí)。 5 5、信度可以解釋、預(yù)測(cè)
21、個(gè)人分?jǐn)?shù)的意義。、信度可以解釋、預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義。三、提高信度的方法(一)影響測(cè)量信度的主要因素 1、被試方面 2、主試方面 3、施測(cè)情境方面 4、測(cè)量工具方面 5、兩次施測(cè)的間隔時(shí)間方面(二)提高測(cè)量信度的常用方法 1、適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度 2、測(cè)驗(yàn)的難度要適中 3、測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì) 4、測(cè)驗(yàn)的程序應(yīng)統(tǒng)一 5、測(cè)驗(yàn)的時(shí)間要充分 6、測(cè)驗(yàn)的評(píng)分要盡量做到客觀化,減少評(píng)分誤差一、什么是效度一、什么是效度 指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說(shuō)是測(cè)量是否達(dá)到了預(yù)期的目的。1、效度是一個(gè)相對(duì)的概念。(1)測(cè)量的效度是相對(duì)一定的測(cè)量目的而言的(2)測(cè)量的效度是相對(duì)測(cè)量的結(jié)果而言的2、一種測(cè)量的
22、效度只是高或低的問(wèn)題 測(cè)量結(jié)果總是有一定效度的,只是效度高低不同罷了。第二節(jié)第二節(jié) 教育測(cè)量與評(píng)價(jià)的效度教育測(cè)量與評(píng)價(jià)的效度 根據(jù)測(cè)量目標(biāo)的不同,對(duì)測(cè)量工具進(jìn)行效根據(jù)測(cè)量目標(biāo)的不同,對(duì)測(cè)量工具進(jìn)行效度驗(yàn)證的方法主要有三種:度驗(yàn)證的方法主要有三種:內(nèi)容效度內(nèi)容效度(基于所測(cè)內(nèi)容的效度驗(yàn)證方法)(基于所測(cè)內(nèi)容的效度驗(yàn)證方法)結(jié)構(gòu)效度結(jié)構(gòu)效度(基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法)(基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法)準(zhǔn)則關(guān)聯(lián)效度準(zhǔn)則關(guān)聯(lián)效度(基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方(基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法)法)二、效度的估計(jì) 1、什么是內(nèi)容效度 指測(cè)驗(yàn)題目樣本對(duì)應(yīng)測(cè)內(nèi)容及行為領(lǐng)域的代表性程度。如果是教學(xué)情境下的成就
23、測(cè)驗(yàn),那么其內(nèi)容效度就是看測(cè)驗(yàn)題目樣本能體現(xiàn)教學(xué)目標(biāo)與教材要求的程度。 例如,教師給學(xué)生做一份語(yǔ)文成就測(cè)驗(yàn),如果該測(cè)驗(yàn)的題目涵蓋了語(yǔ)文教學(xué)所達(dá)到的各項(xiàng)目標(biāo)及教材的重要內(nèi)容,那么我們便說(shuō)該測(cè)驗(yàn)具有較高的內(nèi)容效度。 為了使測(cè)驗(yàn)的內(nèi)容具有有效性,成為所欲測(cè)量?jī)?nèi)容的一個(gè)具有代表性的行為樣本,在編制測(cè)驗(yàn)時(shí),就要考慮建立內(nèi)容效度的問(wèn)題。(一)內(nèi)容效度(一)內(nèi)容效度2、內(nèi)容效度的估計(jì)(1)邏輯分析法)邏輯分析法 其工作思路是請(qǐng)有關(guān)專(zhuān)家對(duì)測(cè)驗(yàn)題目與原定內(nèi)其工作思路是請(qǐng)有關(guān)專(zhuān)家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。容范圍的吻合程度作出判斷。 以考試內(nèi)容效度分析來(lái)說(shuō),就是依靠專(zhuān)家來(lái)分以考試內(nèi)容效度分析來(lái)說(shuō),
24、就是依靠專(zhuān)家來(lái)分析一份試卷的所有題目,把所有題目按考試內(nèi)析一份試卷的所有題目,把所有題目按考試內(nèi)容分布和考查目標(biāo)分布進(jìn)行雙向分類(lèi),形成實(shí)容分布和考查目標(biāo)分布進(jìn)行雙向分類(lèi),形成實(shí)際的際的“題目雙向分類(lèi)表題目雙向分類(lèi)表”;基于這個(gè);基于這個(gè)“題目雙題目雙向分類(lèi)表向分類(lèi)表”的分析,然后由專(zhuān)家對(duì)這次考試的分析,然后由專(zhuān)家對(duì)這次考試(測(cè)量)的內(nèi)容效度的滿(mǎn)意程度作出等級(jí)判斷(測(cè)量)的內(nèi)容效度的滿(mǎn)意程度作出等級(jí)判斷或評(píng)語(yǔ)描述。或評(píng)語(yǔ)描述。 這里不妨先提供一份測(cè)驗(yàn)的命題雙向細(xì)目表這里不妨先提供一份測(cè)驗(yàn)的命題雙向細(xì)目表(參見(jiàn)表(參見(jiàn)表3-9,p62),以增加讀者的感性認(rèn)識(shí)。),以增加讀者的感性認(rèn)識(shí)。(2)量化分
25、析法()量化分析法(p63) 內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)、學(xué)科測(cè)內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)、學(xué)科測(cè)驗(yàn)、選拔和分類(lèi)職業(yè)測(cè)驗(yàn)。驗(yàn)、選拔和分類(lèi)職業(yè)測(cè)驗(yàn)。 內(nèi)容效度不適合用于能力傾向和人格測(cè)內(nèi)容效度不適合用于能力傾向和人格測(cè)驗(yàn)。驗(yàn)。(二)結(jié)構(gòu)效度 結(jié)構(gòu)(Construct)是指心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì)。它本身觀察不到、并且也無(wú)法直接測(cè)量到,但學(xué)術(shù)理論假設(shè)它是存在的,以便能夠來(lái)解釋和預(yù)測(cè)個(gè)人或團(tuán)體的行為表現(xiàn)。 例如,智力就是心理學(xué)中的一種結(jié)構(gòu)結(jié)構(gòu)效度,指的就是測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上(通常是心理學(xué)或社會(huì)學(xué))所定義的某一心理結(jié)構(gòu)或特質(zhì)的程度。 (二)結(jié)構(gòu)效度 結(jié)構(gòu)效度測(cè)驗(yàn)對(duì)于人的心理特性或理論概念
26、測(cè)量到的程度。通常用某種操作來(lái)定義,并用測(cè)驗(yàn)來(lái)測(cè)量。 例如:人的創(chuàng)造力可以分解為人的思維流暢性、靈活性和創(chuàng)造性三大特性,并根據(jù)這三大特性編制測(cè)驗(yàn),若有足夠的證據(jù)來(lái)證明該測(cè)驗(yàn)確實(shí)可以測(cè)到這些特性,則認(rèn)為該測(cè)驗(yàn)是個(gè)結(jié)構(gòu)效度較高的創(chuàng)造力測(cè)驗(yàn)。1、結(jié)構(gòu)效度的特點(diǎn) 結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對(duì)同一種心理特質(zhì)有著不同的定義或假設(shè),則會(huì)使得關(guān)于特質(zhì)測(cè)驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無(wú)法比較。 當(dāng)實(shí)際測(cè)量的資料無(wú)法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效度高。因?yàn)檫€有可能出現(xiàn)理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z查等情況,這就使得結(jié)構(gòu)效度的獲取更為困難。2、建立結(jié)構(gòu)效
27、度的步驟 A、提出理論假設(shè); B、根據(jù)假定結(jié)構(gòu)擬定測(cè)題,編制測(cè)驗(yàn); C、以測(cè)驗(yàn)結(jié)果為根據(jù)來(lái)驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立。3、結(jié)構(gòu)效度的估計(jì)(1)因素分析法 其目的是把一些具有錯(cuò)綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個(gè)綜合因素或稱(chēng)共同因素,并以此測(cè)驗(yàn)所測(cè)之特質(zhì)對(duì)測(cè)驗(yàn)分?jǐn)?shù)作出解釋。(2)多元特質(zhì)多重方法矩陣法 是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評(píng)估方法。 這種方法的設(shè)想:若采用兩種方法以上的方法去測(cè)量?jī)煞N以上的特質(zhì),那么這些測(cè)量結(jié)果之間可以形成一個(gè)多元特質(zhì)多重方法矩陣。 從理論上說(shuō),以不同方法測(cè)量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方法測(cè)量不同特質(zhì)的相關(guān)次之;以不同方法測(cè)量特質(zhì)
28、的相關(guān)為最低。 與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。(三)效標(biāo)關(guān)聯(lián)效度 是以測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來(lái)表示測(cè)驗(yàn)效度高低的方法。 例如:某年全國(guó)高考物理學(xué)科的測(cè)驗(yàn)效度,可用大學(xué)一年級(jí)物理學(xué)科的測(cè)驗(yàn)分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)。當(dāng)這個(gè)相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時(shí),相關(guān)系數(shù)的值(正值)越大,效度就越高;相關(guān)系數(shù)的值越小,效度就越低。 效標(biāo)不僅隨測(cè)驗(yàn)的種類(lèi)不同而不同,而且可能隨時(shí)間而改變,現(xiàn)在是一個(gè)好的成功的效標(biāo),將來(lái)就不一定是。所以,為某個(gè)測(cè)驗(yàn)選擇一個(gè)最有效的效標(biāo),這是最重要的事情。 教育測(cè)驗(yàn)的效標(biāo),可采用各學(xué)科成績(jī)和教師評(píng)定的結(jié)果; 智力測(cè)驗(yàn)的效標(biāo),可采用學(xué)科成績(jī)、教師評(píng)判的結(jié)果、學(xué)生總成績(jī)、受教育年限、年齡以及其他事物; 能力傾向測(cè)驗(yàn)的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績(jī); 職業(yè)興趣測(cè)驗(yàn)的效標(biāo),可采用從業(yè)人員實(shí)際服務(wù)成績(jī)或記錄; 人格測(cè)驗(yàn)的效標(biāo),可采用編制者的主觀標(biāo)準(zhǔn),或以被試
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年農(nóng)業(yè)跨境投資合規(guī)操作指南
- 2026年農(nóng)用傳感器部署維護(hù)技巧
- 2026浙江臺(tái)州市立醫(yī)院招聘高層次衛(wèi)技人員28人備考題庫(kù)及1套參考答案詳解
- 2026河南漯河市源匯區(qū)農(nóng)信聯(lián)社寒假實(shí)習(xí)生招募15人備考題庫(kù)及參考答案詳解1套
- 2026湖南郴州市桂陽(yáng)縣縣直事業(yè)單位選聘5人備考題庫(kù)及完整答案詳解1套
- 2026年農(nóng)業(yè)信貸風(fēng)控模型構(gòu)建方法
- 職業(yè)噪聲工人心血管健康管理的實(shí)踐指南
- 職業(yè)健康監(jiān)護(hù)檔案與危害因素監(jiān)測(cè)數(shù)據(jù)整合分析
- 馬鞍山2025年安徽馬鞍山師范高等專(zhuān)科學(xué)校招聘緊缺專(zhuān)業(yè)碩士21人筆試歷年參考題庫(kù)附帶答案詳解
- 職業(yè)人群高血脂的飲食干預(yù)方案
- 拖欠工程款上訪(fǎng)信范文
- ISO 31000-2023 風(fēng)險(xiǎn)管理 中文版
- 數(shù)字化與碳中和園區(qū)篇
- 八年級(jí)歷史上冊(cè)期末測(cè)試題帶答案
- 花城版音樂(lè)七年級(jí)下冊(cè)53康定情歌教案設(shè)計(jì)
- 2023年江蘇省中學(xué)生生物奧林匹克競(jìng)賽試題及答案
- 燃料質(zhì)量化學(xué)技術(shù)監(jiān)督
- 中醫(yī)內(nèi)科學(xué)癃閉
- 歷屆湖北華師一附中自主招生物理試題
- GM/T 0002-2012SM4分組密碼算法
- GB/T 8243.1-2003內(nèi)燃機(jī)全流式機(jī)油濾清器試驗(yàn)方法第1部分:壓差-流量特性
評(píng)論
0/150
提交評(píng)論