華東師大數(shù)學(xué)教學(xué)測量和評估教案02測驗的統(tǒng)計指標(biāo)-3難度和區(qū)分度_第1頁
華東師大數(shù)學(xué)教學(xué)測量和評估教案02測驗的統(tǒng)計指標(biāo)-3難度和區(qū)分度_第2頁
華東師大數(shù)學(xué)教學(xué)測量和評估教案02測驗的統(tǒng)計指標(biāo)-3難度和區(qū)分度_第3頁
華東師大數(shù)學(xué)教學(xué)測量和評估教案02測驗的統(tǒng)計指標(biāo)-3難度和區(qū)分度_第4頁
華東師大數(shù)學(xué)教學(xué)測量和評估教案02測驗的統(tǒng)計指標(biāo)-3難度和區(qū)分度_第5頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三節(jié)難度和區(qū)分度一個測驗的信度和效度在很大程度上取決于該測驗的題目參數(shù)(難度和區(qū)分度),編制和篩選具有適當(dāng)參數(shù)的題目是改善測驗信度和效度的前提。在通常情況下只要討論常模參照測驗中題目的難度和區(qū)分度。一、難度受測團(tuán)體中被試者在答案范圍內(nèi)回答題目的程度稱為難度。一般用難度指數(shù)p表示題目的難度。1.題目難度的計算當(dāng)題目的評分為多值時,受測者的得分可能是x(x=1,2,…,n,n為該題滿分?jǐn)?shù))。所謂難度指數(shù)(有時也稱得分率),就是該題平由此可見,平均分越高,p值越大,題目的難度越??;平均分越低,p值越小,題目的難度越大。當(dāng)題目為二值評分(即0、1評分)時,上式可變形為其中,N是答題人數(shù),R是答對人數(shù)。這種難度指數(shù)也稱為通過率,一般用于是非題或多項選擇題。由通過率可知,答對人數(shù)越多,p值越大,題目的難度越?。淮饘θ藬?shù)越少,p值越小,題目的難度越大。形式為多選一的選擇題有多個可能的答案供受測者選擇。選擇正確答案的人數(shù)可能會受猜測機(jī)遇的影響,可供選擇的答案越少,這種機(jī)遇的影響就越大。對此,可以用公式對難度指數(shù)p進(jìn)行校正。其中,Cp是校正后的難度指數(shù),p是校正前的難度指數(shù),k是每個題目可供選擇的答案數(shù)。2.題目難度的等距量表在進(jìn)行測量時,用來表示一些對象和事件的某些特征的指標(biāo)稱作量表。根據(jù)不同的單位和參照點,從低級到高級,從模糊到精確,可以用不同的量表表示。用平均得分比率或答對人數(shù)比率表示難度,僅說明事物含有某種屬性的多少,它是無相等單位,不具有等距性和可加性的順序量表。這種量表只能表示事物間的大小、次序關(guān)系,不能反映兩個比率間的數(shù)量差異。我們可以把這種量表轉(zhuǎn)換成不僅有大小關(guān)系,而且有相等單位和規(guī)定參照點的等距量表,使其能表示題目之間難度差異的大小。美國教育測驗服務(wù)處(ETS)采用的難度指數(shù)為Δ=13+4Z,其中,Δ是正態(tài)化的等距難度指數(shù),13是平均數(shù),4是標(biāo)準(zhǔn)差,Z是標(biāo)準(zhǔn)正態(tài)曲線下的面積(即p值)所對應(yīng)的值。轉(zhuǎn)換后的難度指數(shù)介于1~25之間,不會出現(xiàn)負(fù)值。題目的難度指數(shù)以多少為宜,以及它與方差、測驗信度、效度、成績分布的關(guān)系,都是值得進(jìn)一步研究的問題。3.難度指數(shù)與方差的關(guān)系當(dāng)題目以0、1評分時,難度指數(shù)p是N個受測者中答對人數(shù)的平均數(shù)。即∑x=Np。答對分?jǐn)?shù)的平方和是∑x2=12+12+12+…+02+02=Np。由原始數(shù)據(jù)計算方差,得=p-p2=p(1-p)=pq。由此可知,答對人數(shù)比率與答錯人數(shù)比率之積正是題目得分的方差。4.難度對信度與效度的影響我們知道,測驗總分的方差可由各個題目的方差和協(xié)方差求得,其中,pi、qi分別是題目i答對與答錯人數(shù)的比率,rij是題目i和題目j之間的相關(guān)系數(shù)。上式可變形為注意到,這等式的左邊就是K-R20公式的分子,當(dāng)rij增大時,等式右邊隨之增大,K-R信度系數(shù)也增大。這說明提高題目間的相關(guān)程度,使題目間的難度接近時,信度系數(shù)就會提高。但是,預(yù)測效度又要求題目的難度有所差異,差異越大,效度越高。也就是說,難度接近的題目對預(yù)測效度不利。可見,內(nèi)在一致性信度與預(yù)測效度之間存在著矛盾。因此實施一個測驗,應(yīng)該根據(jù)測驗的目的,使上述矛盾的兩個方面保持合理的得失。5.難度與測驗分?jǐn)?shù)的分布對于一個測驗,不能為了追求高信度,使每個題目的難度都很接近,也不能為了追求高效度,而使題目的難度從最易到最難全都涉及。在一般情況下,標(biāo)準(zhǔn)化的樣本組所構(gòu)成的測驗分?jǐn)?shù)分布呈正態(tài)分布(圖2-1);如果題目太難,頻數(shù)集中于分布的左側(cè),呈現(xiàn)正偏態(tài)(圖2-2);如果題目太易,頻數(shù)集中于分布的右側(cè),呈現(xiàn)負(fù)偏態(tài)(圖2-3)。測驗中各個題目的難度必須與測驗的性質(zhì)、目的相協(xié)調(diào)。如果是篩選尖子的數(shù)學(xué)競賽,應(yīng)該盡可能有相當(dāng)難度的題目;如果為選拔學(xué)生進(jìn)入高一級學(xué)校學(xué)習(xí)的能力測驗或?qū)W業(yè)成就測驗,應(yīng)盡量使題目的難度適中;如果是教學(xué)狀態(tài)測驗,應(yīng)以基本的、難度較低的題目為主。盡管難度適中的測驗以難度指數(shù)0.5為宜,但并不是一個測驗每一題的難度都為0.5。因為這會使測驗分?jǐn)?shù)的分布呈雙峰狀態(tài),50%的學(xué)生將所有題目都答對,另外50%的學(xué)生將所有題目都答錯。測驗題的難度應(yīng)有合理的分布,如分布在0.30~0.70,這樣可使測驗的成績接近正態(tài)分布,并使測驗的難度適中。二、區(qū)分度題目對受測者作答反應(yīng)的鑒別程度稱為區(qū)分度。它是題目對受測者心理屬性進(jìn)行區(qū)分能力的指標(biāo)。題目區(qū)分度的高低意味著測題對于能力強(qiáng)與弱的學(xué)生在測驗分?jǐn)?shù)上區(qū)分和鑒別度的高低。因此,它是編制常模參照測驗中篩選題目的主要指標(biāo)。1.題目區(qū)分度的計算根據(jù)測驗題目和已經(jīng)具備的數(shù)據(jù)資料可以確定題目的區(qū)分度。(1)分組法將受測團(tuán)體按某題目得分的高低排列,取高分人數(shù)的27%為一組,他們的得分率記作PH;低分人數(shù)的27%為另一組,他們的得分率記作PL,則該題的區(qū)分度為D=PH-PL。當(dāng)題目是0、1評分時,PH、PL分別是高、低分組在該題答對人數(shù)的比率;當(dāng)題目是多值評分時,PH、PL分別是高、低分組在該題的得分率。(2)相關(guān)法當(dāng)題目為0、1評分時,可以用二列相關(guān)系數(shù)rb和點二列相關(guān)系數(shù)rpbi(見第二節(jié)二列相關(guān)法)計算題目的區(qū)分度,其中,rb,rpbi均為區(qū)答錯的受測者測驗總分的平均數(shù),St是所有受測者測驗總分的標(biāo)準(zhǔn)差。當(dāng)題目為多值評分時,可以用受測者在某題上的得分與其測驗總分之間的積差相關(guān)計算區(qū)分度。(3)方差法我們知道,方差是反映一組受測者分?jǐn)?shù)離散程度的指標(biāo),題目得分的離散程度越高,區(qū)分度也越高。經(jīng)統(tǒng)計分析可以知道積差相關(guān)系數(shù)r與方差S2之間有很高的一致性。在實際應(yīng)用中,為了選擇區(qū)分度高的題目,用方差S2作為區(qū)分度指標(biāo)較為恰當(dāng)。這是由于:S2的計算是因題目而異的,不受其他題目的影響;由研究得到的S2=b0+b1r與r=b′0+b′1S2,表明b1遠(yuǎn)大于b′1,因而S2更能拉開點與點之間的距離,這對衡量區(qū)分度的高低給出了比r更精確的尺度;當(dāng)r小于α=0.05或α=0.01的臨界值時,在統(tǒng)計意義上比較它們的大小都是沒有顯著性價值的,但是對S2卻無此顧慮,并且它的計算比較簡單。(4)特征曲線法用受測團(tuán)體中受測者所得測驗總分與他們在某題的得分率繪制的題目特征曲線,給出一種簡單形象的區(qū)分度分析方法。觀察特征曲線的變化趨勢,可以清楚地區(qū)分該題目對哪一部分學(xué)生的成績具有考察功能。例如,抽取100個考生作為繪制題目特征曲線的樣本,他們的測驗總分在某一分?jǐn)?shù)段上的人數(shù)和在某一試題(該試題滿分6分)上的得分率情況可列成表2-7。以測驗總分為橫坐標(biāo),該題的得分率為縱坐標(biāo),將每個受測者的得分情況在直角坐標(biāo)系內(nèi)描點,連線,即為該題的特征曲線。圖2-4所示的曲線是1992年高考上海數(shù)學(xué)試題第18、21、26題的特征曲線。從圖中可見,不論學(xué)生測驗成績的高低,第21題的得分率相當(dāng)接近,所以該題的區(qū)分度較低;測驗成績?yōu)橹械人降膶W(xué)生,第18題的得分率差異較大,所以該題對中等水平學(xué)生有較高的區(qū)分度;測驗成績較高的學(xué)生,在第26題的得分率差異較大,所以該題有能區(qū)分成績較好學(xué)生的功能。2.區(qū)分度與難度的關(guān)系用方差S2作為區(qū)分度的指標(biāo),由方差與答對率p的關(guān)系可知,題目的方差依賴于難度而變化,當(dāng)p接近于1或0的,S2=pq都接近于零;可以證明當(dāng)p=0.5時,pq達(dá)到最大。由此可知,中等難度的題目,它的區(qū)分度最大。例如,某題如果在10個受測者中僅有1人答對,這個答對者與其他9人中每人都有差異,該題共有1×9個差異;如果10個受測者中僅有2人答對,該題共有2×8=16個差異;如果10個受測者中有5人答對,該題共有5×5=25個差異,這時差異最大,所以區(qū)分度最高。3.區(qū)分度與信度、效度的關(guān)系題目的區(qū)分度受到難度的影響,區(qū)分度與難度又涉及測驗的信度與效度,它們之間相互制約,頗為復(fù)雜。因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論