版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于測(cè)驗(yàn)質(zhì)量分析第1頁(yè),共63頁(yè),2023年,2月20日,星期五
第一節(jié)題目難度的概念和計(jì)算方法
一、題目難度的概念和意義(一)題目難度的含義題目難度是指被試完成試題的難易程度。(二)題目難度與測(cè)驗(yàn)的關(guān)系題目難度影響測(cè)驗(yàn)的難度分布和平均難度,從而影響測(cè)驗(yàn)的信度、效度以及測(cè)驗(yàn)結(jié)果區(qū)分被試水平高低的能力。第2頁(yè),共63頁(yè),2023年,2月20日,星期五二、難度的計(jì)算(一)二值記分法題目的難度計(jì)算當(dāng)題目分?jǐn)?shù)是二分變量(即答對(duì)為1,答錯(cuò)為0,如選擇題)時(shí):式中:P為題目難度值,R為答對(duì)或通過(guò)該題的人數(shù),N為全體考生數(shù)。例題1:在一測(cè)驗(yàn)的某道選擇題上,100名被試中選擇正確答案的有37名。則該題難度為:第3頁(yè),共63頁(yè),2023年,2月20日,星期五
(二)非二值記分法題目的難度計(jì)算
當(dāng)題目分?jǐn)?shù)是多分值時(shí),難度是全體被試在該題上的平均數(shù)與該題滿(mǎn)分的比例:式中:P題目難度值,為全體被試平均得分,Xmax是題目滿(mǎn)分。第4頁(yè),共63頁(yè),2023年,2月20日,星期五例題2:一組被試在某道題上得分分別為2,5,9,10,4,8,7,5,3,0。該題滿(mǎn)分為10分。則該題難度為:第5頁(yè),共63頁(yè),2023年,2月20日,星期五三、測(cè)驗(yàn)難度的選擇一般常模參照測(cè)驗(yàn)題目難度分布近似正態(tài)。特定的測(cè)驗(yàn)題目難度的分布應(yīng)該根據(jù)測(cè)量的任務(wù)而定。第6頁(yè),共63頁(yè),2023年,2月20日,星期五第二節(jié)區(qū)分度的概念和計(jì)算方法一、區(qū)分度的含義區(qū)分度是指試題能區(qū)分被試水平能力的程度。二、區(qū)分度的計(jì)算(一)區(qū)分度的相關(guān)計(jì)算法它是求試題分?jǐn)?shù)與總分的相關(guān)系數(shù)作為區(qū)分度的指標(biāo)。第7頁(yè),共63頁(yè),2023年,2月20日,星期五第8頁(yè),共63頁(yè),2023年,2月20日,星期五第9頁(yè),共63頁(yè),2023年,2月20日,星期五第10頁(yè),共63頁(yè),2023年,2月20日,星期五(二)區(qū)分度的分組計(jì)算法它是首先將全體被試按總分高低進(jìn)行排隊(duì);然后,將得分較高的27%的被試作為“高分組”,將得分較低的27%的被試作為“低分組”;最后求兩組在試題上得分率的差。即:D=PH-PL式中:D為區(qū)分度;PH為高分組的得分率;PL為低分組的得分率。第11頁(yè),共63頁(yè),2023年,2月20日,星期五例如:某班40名學(xué)生,“高分組”做對(duì)第一題的有8人,“低分組”做對(duì)的有4人,那么,該題的區(qū)分度為:D=PH-PL=8/11-4/11≈0.36
第12頁(yè),共63頁(yè),2023年,2月20日,星期五三、區(qū)分度的評(píng)價(jià)區(qū)分度的取值范圍–1≤D≤1。當(dāng)用分組計(jì)算法得到的題目區(qū)分度大于0.4時(shí),區(qū)分度的分組計(jì)算法被認(rèn)為是性能良好的試題。第13頁(yè),共63頁(yè),2023年,2月20日,星期五
第三節(jié)測(cè)驗(yàn)的信度
一、信度的概念信度是指測(cè)驗(yàn)結(jié)果的可靠程度。二、信度的統(tǒng)計(jì)學(xué)原理rxx=S2T/S2X式中:rxx表示信度系數(shù);
S2T表示真分?jǐn)?shù)方差;
S2X表示實(shí)得分?jǐn)?shù)方差。有關(guān)系式:X=T+E其中,X為實(shí)得分?jǐn)?shù);T為真分?jǐn)?shù)。第14頁(yè),共63頁(yè),2023年,2月20日,星期五三、信度系數(shù)的估計(jì)方法1.穩(wěn)定性系數(shù)(再測(cè)信度)它是同一被試總體用同一試卷間隔一段時(shí)間后兩次測(cè)驗(yàn)所得數(shù)據(jù)的一致性程度。通常用相關(guān)系數(shù)作為其估計(jì)值。第15頁(yè),共63頁(yè),2023年,2月20日,星期五2.等值性系數(shù)(復(fù)本信度)它是同一被試總體用兩份等值的試卷,在間隔很短的時(shí)間內(nèi)先后兩次測(cè)驗(yàn)所得數(shù)據(jù)的一致性程度。通常用相關(guān)系數(shù)作為其估計(jì)值。第16頁(yè),共63頁(yè),2023年,2月20日,星期五第17頁(yè),共63頁(yè),2023年,2月20日,星期五例:用一個(gè)由100題構(gòu)成的試卷測(cè)試10名學(xué)生,測(cè)試結(jié)果如下表,求測(cè)驗(yàn)的分半信度系數(shù)。學(xué)號(hào)奇數(shù)題總分偶數(shù)題總分138372373733836441395403963634738388393994039103536第18頁(yè),共63頁(yè),2023年,2月20日,星期五解題步驟如下:
1、先求兩分測(cè)驗(yàn)的相關(guān)系數(shù)rhh
。
..\分半信度.xls
學(xué)號(hào)奇數(shù)題總分偶數(shù)題總分138372373733836441395403963634738388393994039103536
0.84第19頁(yè),共63頁(yè),2023年,2月20日,星期五第20頁(yè),共63頁(yè),2023年,2月20日,星期五(2)α系數(shù)若測(cè)驗(yàn)中各個(gè)題目得分相關(guān)較高時(shí),不論題目的內(nèi)容或形式有何差別,測(cè)驗(yàn)都為同質(zhì);相反,即使所有題目看起來(lái)都好像是測(cè)量同一特性,但題目得分之間的相關(guān)很低,測(cè)驗(yàn)仍然是異質(zhì)的。測(cè)驗(yàn)越同質(zhì),同質(zhì)性信度的值也越大,則說(shuō)明試題的內(nèi)部一致性程度越高。因而,同質(zhì)性信度又稱(chēng)作內(nèi)部一致性系數(shù)。計(jì)算同質(zhì)性信度的方法可用克龍巴赫(Cronbach)所創(chuàng)的α系數(shù)公式:第21頁(yè),共63頁(yè),2023年,2月20日,星期五第22頁(yè),共63頁(yè),2023年,2月20日,星期五例:5名被試參加一個(gè)包含6道試題的測(cè)驗(yàn),測(cè)驗(yàn)結(jié)果如下表,求該測(cè)驗(yàn)的信度系數(shù)。題號(hào)被試Si2ABCDE1711811113.042697891.3636106892.5648116836.965711811113.046711811113.04合計(jì)416343575420
70.24第23頁(yè),共63頁(yè),2023年,2月20日,星期五第24頁(yè),共63頁(yè),2023年,2月20日,星期五4.評(píng)分者信度系數(shù)對(duì)于無(wú)法完全客觀(guān)記分的測(cè)驗(yàn),評(píng)分者的主觀(guān)因素對(duì)測(cè)驗(yàn)結(jié)果的影響是很大的,因此需要控制評(píng)分誤差和研究評(píng)分者信度。評(píng)分者信度的估計(jì)可以分為兩種情況:(1)2人同時(shí)評(píng)多份相同的試卷這種情況可以用2人評(píng)分的相關(guān)系數(shù)作為評(píng)分者信度的估計(jì)值。第25頁(yè),共63頁(yè),2023年,2月20日,星期五例如:兩位教師評(píng)三份試卷,求其評(píng)分者信度系數(shù)試卷教師X教師YDD2112-112211133300合計(jì)
2第26頁(yè),共63頁(yè),2023年,2月20日,星期五第27頁(yè),共63頁(yè),2023年,2月20日,星期五第28頁(yè),共63頁(yè),2023年,2月20日,星期五第29頁(yè),共63頁(yè),2023年,2月20日,星期五第30頁(yè),共63頁(yè),2023年,2月20日,星期五例如:三位教師評(píng)四份試卷,所評(píng)等級(jí)如下表,問(wèn)該測(cè)驗(yàn)的評(píng)分者信度如何?教師試卷1234A3142B2141C2232Ri74115第31頁(yè),共63頁(yè),2023年,2月20日,星期五第32頁(yè),共63頁(yè),2023年,2月20日,星期五第33頁(yè),共63頁(yè),2023年,2月20日,星期五第34頁(yè),共63頁(yè),2023年,2月20日,星期五(5)查表,檢驗(yàn)W的顯著性因?yàn)?,K=3,N=4時(shí),臨界值S0.05≈64.4,由于S<S0.05,所以,W不顯著性,即表明三位教師的評(píng)分者信度較低。(K在3——20之間,N在3——7之間時(shí),查附表5求臨界值S0.05或臨界值S0.01;若N>7,檢驗(yàn)W的顯著性用χ2=K(N-1)W,按df=N-1查χ2值表進(jìn)行比較。)參考書(shū)目:1.王漢瀾主編《教育測(cè)量學(xué)》2.宋嶺梅主編《教育測(cè)量學(xué)》第35頁(yè),共63頁(yè),2023年,2月20日,星期五四、影響信度的因素被試樣本的影響。題目數(shù)量的影響。測(cè)驗(yàn)難度的影響。測(cè)驗(yàn)內(nèi)容同質(zhì)性的影響。評(píng)分客觀(guān)性的影響。第36頁(yè),共63頁(yè),2023年,2月20日,星期五
第四節(jié)測(cè)驗(yàn)的效度
一、效度的概念效度是測(cè)驗(yàn)?zāi)軐?shí)際測(cè)量出其所要測(cè)量特性的程度。二、效度的統(tǒng)計(jì)學(xué)原理rxy=S2v/S2X式中,S2v潛在真分?jǐn)?shù)方差;
S2x實(shí)得分?jǐn)?shù)方差。有關(guān)系式:X=T+E=V+I+E其中,V為潛在真分?jǐn)?shù);I為系統(tǒng)誤差。第37頁(yè),共63頁(yè),2023年,2月20日,星期五三、估計(jì)效度的方法1.內(nèi)容效度(Contentvalidity)
內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適當(dāng)性。(1)專(zhuān)家判斷法采用專(zhuān)家判斷法可以按下面的步驟進(jìn)行:①定義好內(nèi)容總體的范圍;②確定考查內(nèi)容或行為的細(xì)目;③列出雙向細(xì)目表;④制訂評(píng)定量表。第38頁(yè),共63頁(yè),2023年,2月20日,星期五(2)統(tǒng)計(jì)分析法統(tǒng)計(jì)分析法又稱(chēng)克龍巴赫估計(jì)法??她埌秃赵岢龉烙?jì)內(nèi)容效度可以從同一教學(xué)內(nèi)容范圍的總體中抽取兩套獨(dú)立的測(cè)驗(yàn)試題,這兩套測(cè)驗(yàn)試題對(duì)同一組考生分別進(jìn)行兩次測(cè)驗(yàn),如測(cè)驗(yàn)得分求得的相關(guān)系數(shù)高,就可推論內(nèi)容效度高;若相關(guān)系數(shù)低,這兩套試題中至少有一套測(cè)驗(yàn)試題缺乏內(nèi)容效度。
第39頁(yè),共63頁(yè),2023年,2月20日,星期五(3)再測(cè)法這種方法是,先對(duì)一組考生進(jìn)行先期測(cè)驗(yàn),這一組學(xué)生必須是對(duì)測(cè)驗(yàn)的內(nèi)容知之甚少,然后對(duì)這一組學(xué)生進(jìn)行有關(guān)內(nèi)容的教學(xué)與訓(xùn)練活動(dòng),經(jīng)過(guò)一段學(xué)習(xí)時(shí)間后,再進(jìn)行后期測(cè)驗(yàn),這樣可以看出測(cè)驗(yàn)是否測(cè)量出深堂上所進(jìn)行的教學(xué)與訓(xùn)練的效果。如果后期測(cè)驗(yàn)成績(jī)好,就說(shuō)明該測(cè)驗(yàn)對(duì)課程內(nèi)容范圍是有效的。
第40頁(yè),共63頁(yè),2023年,2月20日,星期五2.效標(biāo)關(guān)聯(lián)效度(Criterionrelatedvalidity)
效標(biāo)關(guān)聯(lián)效度指的是測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)之間的一致性程度。效標(biāo)(criterion)。效標(biāo)實(shí)際上是指本測(cè)驗(yàn)所想測(cè)量或要預(yù)測(cè)的特性和功能。
效標(biāo)關(guān)聯(lián)效度分為兩種:效標(biāo)與本測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得的,稱(chēng)為同時(shí)效度或并存效度(concurrentvalidity);效標(biāo)在本測(cè)驗(yàn)之后相當(dāng)時(shí)間獲得的,稱(chēng)為預(yù)測(cè)效度(predictivevalidity)。第41頁(yè),共63頁(yè),2023年,2月20日,星期五預(yù)測(cè)效度和同時(shí)效度有兩點(diǎn)區(qū)別:(1)從進(jìn)行本測(cè)驗(yàn)到獲得效標(biāo)的間隔時(shí)間不同。同時(shí)效度的效標(biāo)測(cè)驗(yàn)幾乎與本測(cè)驗(yàn)同時(shí)舉行;預(yù)測(cè)效度的效標(biāo)則在本測(cè)驗(yàn)之后相當(dāng)長(zhǎng)的時(shí)間(幾個(gè)月,到幾年)才獲得。(2)目的和作用不同。同時(shí)效度主要用來(lái)查明自編測(cè)驗(yàn)的效度,以便有效地研制和使用新測(cè)驗(yàn);預(yù)測(cè)效度主要用來(lái)評(píng)價(jià)本測(cè)驗(yàn)的預(yù)測(cè)能力。第42頁(yè),共63頁(yè),2023年,2月20日,星期五估計(jì)效標(biāo)關(guān)聯(lián)效度的主要方法有:
(1)相關(guān)法它是以相關(guān)系數(shù)作為效度系數(shù)(validitycoefficient)的估計(jì)值。第43頁(yè),共63頁(yè),2023年,2月20日,星期五(2)命中率法當(dāng)測(cè)驗(yàn)是用作決定取舍標(biāo)準(zhǔn)的根據(jù)時(shí),其有效性的指標(biāo)可以看作正確決定的比例,該比例越高,說(shuō)明測(cè)驗(yàn)越有效。①取舍的正確性一般各級(jí)學(xué)校的招生考試或各企事業(yè)單位選聘人員的錄取聘用,都可以采用這種方法。為了得到取舍正確性指標(biāo),必須將原測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料都采用二值劃分,這是最簡(jiǎn)單的一種劃分方法。
第44頁(yè),共63頁(yè),2023年,2月20日,星期五例如,原測(cè)驗(yàn)分?jǐn)?shù)可以分成錄取和不錄取兩類(lèi),效標(biāo)資料可分為成功與失敗兩類(lèi),這樣全部被試可分為四個(gè)組,如下表所示:
效標(biāo)成績(jī)失敗成功測(cè)驗(yàn)成績(jī)錄取失誤(A)命中(B)不錄取命中(C)失誤(D)第45頁(yè),共63頁(yè),2023年,2月20日,星期五第46頁(yè),共63頁(yè),2023年,2月20日,星期五例如:
效標(biāo)成績(jī)失敗成功測(cè)驗(yàn)成績(jī)錄取75(A)15(B)60不錄取175(C)152(D)23第47頁(yè),共63頁(yè),2023年,2月20日,星期五第48頁(yè),共63頁(yè),2023年,2月20日,星期五第49頁(yè),共63頁(yè),2023年,2月20日,星期五第50頁(yè),共63頁(yè),2023年,2月20日,星期五3.結(jié)構(gòu)效度結(jié)構(gòu)效度指的是測(cè)驗(yàn)分?jǐn)?shù)能夠說(shuō)明心理的某種結(jié)構(gòu)或特征的程度。(1)邏輯推理法它是通過(guò)對(duì)心理某種結(jié)構(gòu)或特性與測(cè)驗(yàn)的吻合性進(jìn)行邏輯分析的方法。例如比奈(A.Binet)首先應(yīng)用邏輯分析方法研究智力行為的心理結(jié)構(gòu),認(rèn)為智力不單純是智力行為的很多不同方面的總和,而是一種連鎖性的過(guò)程,其中包括判斷、解決問(wèn)題和推理作用。如果根據(jù)這種理論編制的智力測(cè)驗(yàn),確實(shí)能測(cè)量出應(yīng)試者的判斷、理解和推理能力,就可以認(rèn)為所編制的測(cè)驗(yàn)具有結(jié)構(gòu)效度。第51頁(yè),共63頁(yè),2023年,2月20日,星期五例如:以智力測(cè)驗(yàn)來(lái)說(shuō)。先要建立關(guān)于智力的一套理論,如智力的定義、結(jié)構(gòu)、與遺傳環(huán)境的關(guān)系,與年齡的關(guān)系,與性別的關(guān)系……等等。根據(jù)這些理論,提出有關(guān)智力測(cè)驗(yàn)的若干假設(shè),如:(1)測(cè)驗(yàn)分?jǐn)?shù)在16歲以前隨年齡而增加;(2)一種智力測(cè)驗(yàn)的分?jǐn)?shù)與其他智力測(cè)驗(yàn)的分?jǐn)?shù)有正相關(guān),(3)測(cè)驗(yàn)分?jǐn)?shù)能區(qū)別智力水平,(4)測(cè)驗(yàn)分?jǐn)?shù)受教學(xué)的直接影響不大等。然后收集材料(這里主要是通過(guò)智力測(cè)驗(yàn)獲得)來(lái)驗(yàn)證假設(shè)。如果假設(shè)得到支持,則可以認(rèn)為所編制的智力測(cè)驗(yàn)的結(jié)果與智力的理論結(jié)構(gòu)符合,即有結(jié)構(gòu)效度。如果假設(shè)沒(méi)有得到測(cè)驗(yàn)結(jié)果的支持,則測(cè)驗(yàn)結(jié)果缺乏結(jié)構(gòu)效度,或者是智力結(jié)構(gòu)的理論有缺陷。第52頁(yè),共63頁(yè),2023年,2月20日,星期五(2)統(tǒng)計(jì)分析法把自己所編制的測(cè)驗(yàn)的施測(cè)結(jié)果,與另一性質(zhì)相同而被公認(rèn)具有較高結(jié)構(gòu)效度的測(cè)驗(yàn)結(jié)果比較。例如把新編制的智力測(cè)驗(yàn)的結(jié)果與斯坦福一一比奈智力量表的測(cè)驗(yàn)結(jié)果相比較,若兩種測(cè)驗(yàn)結(jié)果的相關(guān)高,可以認(rèn)為新編測(cè)驗(yàn)也具有較高的結(jié)構(gòu)效度。第53頁(yè),共63頁(yè),2023年,2月20日,星期五(3)考察實(shí)驗(yàn)因素法因素分析的主要作用在于從相關(guān)的許多因素中,找出潛藏在其中的對(duì)某種現(xiàn)象起決定作用的基本因素。這種方法是利用實(shí)驗(yàn)前后的結(jié)果變化,來(lái)說(shuō)明測(cè)驗(yàn)的結(jié)構(gòu)效度。第54頁(yè),共63頁(yè),2023年,2月20日,星期五四、影響效度的因素測(cè)驗(yàn)難度的影響。題目數(shù)量的影響。測(cè)驗(yàn)實(shí)施的影響。評(píng)分客觀(guān)性的影響。要求測(cè)驗(yàn)標(biāo)準(zhǔn)化的其他因素的影響。被試樣本的影響。所選效標(biāo)的影響。第55頁(yè),共63頁(yè),2023年,2月20日,星期五五、效度與信度的關(guān)系1.高信度不一定又高效度
S2XS2T2.高效度一定有高信度
S2XS
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 實(shí)驗(yàn)報(bào)告:基礎(chǔ)生命支持(BLS)演練
- 柴油發(fā)電機(jī)考試題庫(kù)及答案
- 復(fù)旦藥理學(xué)試題庫(kù)及答案
- 2025-2026七年級(jí)美術(shù)上學(xué)期冀教版卷
- 肝衰竭肝移植術(shù)后出血防治策略
- 公司走廊衛(wèi)生制度
- 衛(wèi)生院自查工作制度
- 飼養(yǎng)場(chǎng)衛(wèi)生防疫制度
- 社區(qū)衛(wèi)生站服務(wù)三項(xiàng)制度
- 衛(wèi)生服務(wù)站診室管理制度
- 安全附件管理制度規(guī)范
- 工程轉(zhuǎn)接合同協(xié)議
- 人教版(2024)七年級(jí)上冊(cè)數(shù)學(xué)期末綜合檢測(cè)試卷 3套(含答案)
- GB/T 16770.1-2025整體硬質(zhì)合金直柄立銑刀第1部分:型式與尺寸
- 工業(yè)產(chǎn)品銷(xiāo)售單位質(zhì)量安全日管控周排查月調(diào)度檢查記錄表
- 2025年風(fēng)險(xiǎn)管理自查報(bào)告
- 2026年中國(guó)煤炭資源行業(yè)投資前景分析研究報(bào)告
- 項(xiàng)目成本控制動(dòng)態(tài)監(jiān)測(cè)表模板
- DBJ46-074-2025 海南省市政道路瀝青路面建設(shè)技術(shù)標(biāo)準(zhǔn)
- 幼兒園小班語(yǔ)言《大一歲了》課件
- GB/T 14071-2025林木品種審定規(guī)范
評(píng)論
0/150
提交評(píng)論